
1107 lines
44 KiB
Executable file
Raw Blame History

This file contains ambiguous Unicode characters

This file contains Unicode characters that might be confused with other characters. If you think that this is intentional, you can safely ignore this warning. Use the Escape button to reveal them.

This program is free software: you can redistribute it and/or modify
it under the terms of the GNU General Public License as published by
the Free Software Foundation, either version 3 of the License, or
(at your option) any later version.
This program is distributed in the hope that it will be useful,
but WITHOUT ANY WARRANTY; without even the implied warranty of
GNU General Public License for more details.
You should have received a copy of the GNU General Public License
along with this program. If not, see <>.
use LanguageDetection\Language;
if (strtoupper(substr(PHP_OS,0,3))==='WIN')
if (function_exists('pcntl_signal')) {
function signalHandler($signal) {
global $link, $jsonf, $lockfp;
echo(N.'Sono stato interrotto.'.N);
if ($link) {
echo('La connessione MySQL è aperta, la chiudo.'.N);
if ($jsonf) {
echo('Il file di dump json è aperto, lo chiudo.'.N);
// qui no, altrimenti "riprendi" fa poi casino
//fwrite($jsonf,'"Fine?": true'.N.'}'.N);
if (isset($lockfp) && file_exists($lockfp)) {
echo('Il file di lock esiste, lo elimino.'.N);
pcntl_signal(SIGTERM,'signalHandler');// Termination ('kill' was called)
pcntl_signal(SIGHUP,'signalHandler');// Terminal log-out
pcntl_signal(SIGINT,'signalHandler');// Interrupted (Ctrl-C is pressed)
'deadline'=>60*24*60*60,// se un'istanza non risponde da 60 giorni dichiararla morta
'ldtoots'=>40,// numero di toots da passare alla funzione di rilevamento automatico della lingua
Popola/aggiorna il database di mastostart con i dati che riesce
a recuperare da una lista di istanze composta da quelle già presenti
nel database più quelle di un file specificabile (tipicamente il file
di output di peerscrawl.php).
peerscrawl.php [options]
-p, --peersfp <file>
Definisce un file da cui caricare la lista delle istanze di cui cercare
di recuperare i dati. Per default non è definito alcun file, quindi
il programma si limita a controllare le istanze già presenti del db.
Nota: questa opzione è ininfluente se il programma viene lanciato
per riprendere unesecuzione precedente interrotta.
-t, --timeout <secondi>
Definisce il timeout in secondi di ogni tentativo di connessione.
DEFAULT: «'.$opts['timeout'].
-N, --dontsetnew
Non marca le istanze come nuove, neanche quando lo sono. Può essere utile
per il primo crawl.
-I, --ignorelock
Normalmente, se il suo lockfile esiste, il programma esce con un errore.
Questa opzione fa sì che il lockfile sia ignorato. Attenzione: verifica
che effettivamente il programma non stia già girando prima di usarla.
-R, --dontrestore
Se sono presenti i file di una sessione precedente non completata
(«instances.job» e «currinst.job») ignorali e prosegui (verranno
-d, --dryrun
Non scrive nulla nel database.
-j, --jsonwrite
Attiva la scrittura di un file «instances.json» nella stessa directory
di crawler.php, contenente tutti i dati recuperati da tutte le istanze.
-h, --help
Mostra questo aiuto ed esce.
This program comes with ABSOLUTELY NO WARRANTY; for details see the source.
This is free software, and you are welcome to redistribute it under
certain conditions; see <> for details.'.N;
for ($i=1; $i<$argc; $i++) {
if (substr($argv[$i],0,1)=='-') {
switch($argv[$i]) {
case '-p':
case '--peersfp':
if ($i+1>=$argc || !file_exists($argv[$i+1]) || !is_file($argv[$i+1]) || !is_readable($argv[$i+1]))
mexit('Lopzione «'.$argv[$i].'» richiede come parametro un file esistente e leggibile (usa «-h» per vedere la guida).'.N,1);
case '-t':
case '--timeout':
if ($i+1>=$argc || preg_match('/^[0-9]+$/',$argv[$i+1])!==1)
mexit('Lopzione «'.$argv[$i].'» richiede un parametro numerico (usa «-h» per vedere la guida).'.N,1);
case '-N':
case '--dontsetnew':
case '-R':
case '--dontrestore':
case '-I':
case '--ignorelock':
case '-d':
case '--dryrun':
case '-j':
case '--jsonwrite':
case '-h':
case '--help':
mexit('Lopzione «'.$argv[$i].'» è sconosciuta (usa «-h» per vedere la guida).'.N,1);
use function mysqli_real_escape_string as myesc;
function mexit($msg,$code) {
global $link, $jsonf, $lockfp;
if ($link)
if ($jsonf)
if (isset($lockfp) && file_exists($lockfp))
if (file_exists($lockfp) && !$opts['ignorelock']) {
echo('Il file di lock esiste: pare che sia già in corso una sessione; se sei sicur@ che non è così usa «-I» per forzare lesecuzione.'.N);
or mexit('Impossibile aprire il file di configurazione «'.$inifp.'»'.N,1);
or mexit('Impossibile connettersi al server MySQL: '.mysqli_connect_error().N,1);
or mexit(__LINE__.': '.mysqli_error($link).N,1);
if (!$opts['dontrestore'] && file_exists($currinstjfp) && file_exists($instsjfp)) {
echo('Pare che ci sia un lavoro in sospeso, provo a riprenderlo...'.N);
or mexit('Non ho potuto aprire in lettura il file «'.$instsjfp.'».'.N,1);
foreach ($buf as $line)
or mexit('Non ho potuto aprire in lettura il file «'.$currinstjfp.'».'.N,1);
$currinst=array('dom'=>$buf[0], 'i'=>$buf[1], 'qok'=>$buf[2], 'qgood'=>$buf[3]);
function truncs($str,$tab,$col,$ctx) {
global $tables, $tronconi, $iswin;
if ($iswin)
if ($len>$size) {
notify($ctx.': ho dovuto troncare a '.$size.' caratteri il valore da inserire nella colonna «'.$col.'» della tabella «'.$tab.'» perché troppo lungo ('.$len.' caratteri).',2);
function truncn($num,$tab,$col,$ctx) {
global $tables, $iswin;
if ($iswin)
if (is_numeric($num)) {
if ($num>$tables[$tab][$col]['max']) {
notify($ctx.': ho dovuto troncare «'.$num.'» al valore massimo «'.$tables[$tab][$col]['max'].'» che può avere nella colonna «'.$col.'» della tabella «'.$tab.'»).',2);
} elseif ($num<$tables[$tab][$col]['min']) {
notify($ctx.': ho dovuto troncare «'.$num.'» al valore minimo «'.$tables[$tab][$col]['min'].'» che può avere nella colonna «'.$col.'» della tabella «'.$tab.'»).',2);
} else {
notify($ctx.': truncn(): mi aspettavo un numero, invece non lo era; ritorno «0».',3);
echo('Carico la blacklist dal database...'.N);
$res=mysqli_query($link,'SELECT * FROM Blacklist')
or mexit(__LINE__.': '.mysqli_error($link).N,3);
echo(mysqli_num_rows($res).' istanze nella blacklist.'.N);
while($row=mysqli_fetch_assoc($res)) {
function pgdatetomy($pgdate) {
if (preg_match('/^(\d+)-(\d+)-(\d+)[ T]{1}(\d+):(\d+):(\d+)(\.\d+)?Z?$/',$pgdate,$buf)===1) {
if (array_key_exists(7,$buf))
} else {
notify('pgdatetomy: «'.$pgdate.'» non è un formato di data riconosciuto! Ritorno il magico momento attuale.',3);
function blpgdumplinetomy($line) {
if (!$riprendi) {
echo('Carico le istanze di riferimento per le blacklist...'.N);
$res=mysqli_query($link,'SELECT Domain FROM StartNodes')
or mexit(__LINE__.': '.mysqli_error($link).N,3);
echo(mysqli_num_rows($res).' istanze di riferimento.'.N);
while($row=mysqli_fetch_assoc($res)) {
/*echo('Recupero la lista delle istanze note a «'.$row['Domain'].'» ... ');
if ($buf['cont']!==false) {
echo('OK :-)'.N);
foreach ($peers as $pdom) {
if (willtrunc($pdom,'Instances','URI'))
notify('Listanza «'.$pdom.'» non sarà considerata perché il suo dominio è troppo lungo per il campo «URI» della tabella «Instances» nel DB',2);
if (!in_array($pdom,$insts) && !willtrunc($pdom,'Instances','URI'))
} else {
echo('ERRORE: '.$buf['cont'].N);
echo('Recupero la blacklist di «'.$row['Domain'].'» ... ');
if ($buf['cont']!==false) {
echo('OK :-)'.N);
foreach ($buf as $line) {
if (preg_match('/(^#.*$)|(^\s*$)/',$line)===0) {
if (!array_key_exists($brow['Domain'],$blacklist)) {
} else {
echo('ERRORE: '.$buf['emsg'].N);
foreach ($blacklistnew as $row) {
if (!willtrunc($row['Domain'],'Blacklist','Domain')) {
if (!$opts['dryrun']) mysqli_query($link,'INSERT INTO Blacklist (ID, Domain, CreatedAt, ModifiedAt, Severity, RejectMedia, RejectReports, PrivateComment, PublicComment) VALUES (NULL, \''.myesc($link,$row['Domain']).'\', \''.myesc($link,$row['CreatedAt']).'\', \''.myesc($link,$row['ModifiedAt']).'\', \''.myesc($link,$row['Severity']).'\', \''.myesc($link,$row['RejectMedia']).'\', \''.myesc($link,$row['RejectReports']).'\', NULL, \''.myesc($link,$row['Domain']).'\')')
or mexit(__LINE__.': '.mysqli_error($link).N,3);
} else {
echo('Non ho potuto inserire «'.$row['Domain'].'» nella tabella delle istanze blacklistate perché il dominio è troppo lungo per il campo corrispondente nel DB.');
echo('Carico le istanze note e vive dal DB e le metto nella lista di quelle da controllare.'.N);
$res=mysqli_query($link,'SELECT URI FROM Instances WHERE Dead=0')
or mexit(__LINE__.': '.mysqli_error($link).N,3);
if (!in_array($row['URI'],$insts))
echo('Creo la lista delle istanze morte.'.N);
$res=mysqli_query($link,'SELECT URI FROM Instances WHERE Dead=1')
or mexit(__LINE__.': '.mysqli_error($link).N,3);
if (!is_null($opts['peersfp'])) {
echo('Carico le istanze dalla lista «'.$opts['peersfp'].'» e aggiungo alla lista di quelle da controllare quelle che non ci sono già e che non risultano morte.'.N);
if ($peers===false)
mexit('Non ho potuto aprire in lettura «'.$opts['peersfp'].'».'.N,1);
foreach ($peers as $pdom) {
if (!in_array($pdom,$insts))
if (!in_array($pdom,$deadinsts))
if (!willtrunc($pdom,'Instances','URI'))
echo('Listanza «'.$pdom.'» non sarà considerata perché il suo dominio è troppo lungo per il campo «URI» della tabella «Instances» nel DB.'.N);
echo('Listanza «'.$pdom.'» non sarà considerata perché È MORTA!'.N);
// shuffle($insts);
echo('Istanze recuperate: '.count($insts).N);
echo('Istanze blacklistate: '.count($blacklist).', di cui '.count($blacklistnew).' nuove aggiunte al DB.'.N);
or mexit('Non ho potuto aprire in scrittura il file «'.$instsjfp.'».'.N,1);
foreach ($insts as $dom)
function willtrunc($str,$tab,$col) {
global $tables, $iswin;
if ($iswin)
if (mb_strlen($str,'UTF-8')>$tables[$tab][$col])
function b2i($bool,$pre) {
if (is_bool($bool)) {
if ($bool)
} else {
notify($pre.'il valore «'.$bool.'» non è booleano, lo assumo come falso e ritorno «0».',3);
//is array, array key exists and value is not null
function akeavinn($key,&$arr) {
if (is_array($arr) && array_key_exists($key,$arr) && !is_null($arr[$key]))
function nempty($str) {
if (preg_match('/^\s*$/',$str)===1)
function subarimp($glue,$key,&$arr) {
foreach ($arr as $inarr) {
if ($i<$carr)
function notify($msg,$sev) {
global $link, $tables, $iswin, $opts;
echo('NOTIFICAZIÒ: '.strip_tags($msg).N);
if ($iswin)
if (!$opts['dryrun']) mysqli_query($link,'INSERT INTO Notifications (ID, Notification, Severity, Microtime, Seen, Deleted) VALUES (NULL, \''.myesc($link,mb_substr($msg,0,$tables[$tab]['Notification'],'UTF-8')).'\', '.$sev.', \''.microtime(true).'\', 0, 0)')
or mexit(__LINE__.': '.mysqli_error($link).N,3);
* Effettua una chiamata alla API di Mastodon.
* @param string $host L'host da chiamare (e.g.: "")
* @param string $path Il path della API (e.g.: "/api/v1/timelines/public?local=true")
* @return mixed L'oggetto ritornato dalla chiamata, già parsato da json_decode, o NULL se la chiamata fallisce
function get_api($host, $path) {
global $opts;
$buf = @getfc('https://'.$host.$path,$opts['timeout']);
if ($buf['cont']!==false) {
$data = json_decode($buf['cont'], true);
return $data;
} else {
return NULL;
* Torna un elenco di linguaggi riconosciuti nel toot fornito con relativa probabilità.
* @param mixed $toot Il toot da analizzare, come ritornato dalle API
* @return array Mappa tra codice lingua e probabilità che il toot sia in quella lingua.
function get_toot_languages($toot) {
if (is_array($toot) && array_key_exists('language',$toot))
$l = $toot['language'];
$l = NULL;
if($l !== NULL) {
// la lingua è specificata già nel toot: usa quella
$langs[$l] = 1;
} elseif (array_key_exists('content',$toot)) {
// la lingua non è specificata: deducila
$text = strip_tags($toot['content']);
$ld = new Language;
$langs = $ld->detect($text)->bestResults()->close();
// raggruppa le lingue derivate, e.g.: "zh" e "zh-CN"
$grouped_langs = array();
foreach($langs as $key => $value) {
$l = explode("-", $key)[0];
if(array_key_exists($l, $grouped_langs)) {
$grouped_langs[$l] = max($grouped_langs[$l], $value);
} else {
$grouped_langs[$l] = $value;
return $grouped_langs;
* Date le probabilità di lingua per ogni toot, calcola la media.
* @param array $detected_langs Array di mappe tra lingua e probabilità
* @return array Mappa tra lingua e probabilità
function summary($detected_langs) {
$res = Array();
foreach($detected_langs as $langs) {
foreach($langs as $l => $weight) {
if(!array_key_exists($l, $res)) {
$res[$l] = 0;
$res[$l] += $weight;
foreach($res as $l => $sumweight) {
$res[$l] = $sumweight / count($detected_langs);
return $res;
* Helper function per usort: compara due array usando il primo elemento.
* @param array $entry1 Primo array da comparare
* @param array $entry2 Secondo array da comparare
* @return number -1, 0 o 1 a seconda che $entry1[0] sia minore, uguale o superiore a $entry2[0]
function sort_weights($entry1, $entry2) {
$w1 = $entry1[0];
$w2 = $entry2[0];
if ($w1 < $w2)
elseif ($w1 == $w2)
return $ret;
* Data una mappa di lingue, ritorna una lista di linguaggi considerati probabili.
* @param array $summary Mappa tra lingue e probabilità
* @return string[] Elenco di lingue considerate probabili
function get_languages($summary) {
$lst = [];
foreach($summary as $code => $weight) {
$lst[] = [$weight, $code];
usort($lst, 'sort_weights');
$languages = [];
$lastweight = 0;
foreach($lst as $entry) {
$l = $entry[1];
$weight = $entry[0];
if($weight < $lastweight * 2 / 3) {
$languages[] = $l;
$lastweight = $weight;
return $languages;
* Ritorna una lista di lingue probabili per la data istanza.
* @param string $host Hostname dell'istanza (e.g.: "")
* @return string[] Lista di lingue probabili
function get_instance_langs($host) {
global $opts;
$data = get_api($host, '/api/v1/timelines/public?local=true&limit='.$opts['ldtoots']);
if($data == NULL) {
return [];
$detected_langs = array_map('get_toot_languages', $data);
$summary = summary($detected_langs);
$languages = get_languages($summary);
return $languages;
function langs($instid, $uri, $auto) {
global $info, $instrow, $link, $opts;
// even if $auto is true, set it to false (don't do autodection of languages based on last toots) if api/v1/instance returned a language different from the default "en": assume instead it is right, because it has been explicitly set
if (isset($info['languages'][0]) && $info['languages'][0]!='en')
if ($auto) {
$languages = get_instance_langs($uri);
} elseif (akeavinn('languages',$info)) {
$languages = $info['languages'];
if (count($languages)==0) {
} else {
if ($auto)
echo('Lingue rilevate: '.implode(', ',$languages).N);
echo('Lingue dichiarate: '.implode(', ',$languages).N);
foreach($languages as $lang) {
$res=mysqli_query($link,'SELECT * FROM Languages WHERE Code=\''.myesc($link,$lang).'\'')
or mexit(__LINE__.': '.mysqli_error($link).N,3);
if (mysqli_num_rows($res)<1) {
$q = 'INSERT INTO Languages (ID, Code, NameOrig, NameUK, NameCA, NameEN, NameES, NameFR, NameGL, NameIT) VALUES (NULL, \''.$code.'\', \''.$NameOrig.'\', \''.$NameUk.'\', \''.$NameCa.'\', \''.$NameEn.'\', \''.$NameEs.'\', \''.$NameFr.'\', \''.$NameGl.'\', \''.$NameIt.'\')';
if (!$opts['dryrun']) {
mysqli_query($link, $q) or mexit(__LINE__.': '.mysqli_error($link).N,3);
} else {
} else {
function varbdump($var) {
function mdasortbykey(&$arr,$key,$rev=false) {
foreach ($arr as $akey=>$subarr)
if (!$rev)
foreach ($karr as $akey=>$subarr)
* Nodeinfo ('https://'.$dom.'/nodeinfo/2.0.json') è stato aggiunto nella 3.0.0
* Trends ('https://'.$dom.'/api/v1/trends') è stato aggiunto nella 3.0.0
* Activity ('https://'.$dom.'/api/v1/instance/activity') è stato aggiunto nella 2.1.2
if ($opts['jsonwrite']) {
if ($riprendi)
or mexit('Non ho potuto aprire in modalità '.$mode[1].' il file di dump delle info json «'.$opts['jsonfp'].'».',1);
if ($mode[0]=='w')
if ($riprendi) {
while ($i<$cinsts) {
or mexit('Non ho potuto aprire in scrittura il file «'.$currinstjfp.'».',1);
echo('~~~~ '.$dom.' - '.$i.'/'.$cinsts.'; '.$qok.' OK; '.$qgood.' BUONE; '.round(100/$cinsts*$i).'%; tempo trascorso: '.ght($tela,null,0).'; stima tempo rimanente: '.ght($tela/$i*($cinsts-$beg)-$tela,null,0).'; mem.: '.ghs(memory_get_usage(true)).' picco mem.: '.ghs(memory_get_peak_usage(true)).' ~~~~'.N);
if (willtrunc($dom,'Instances','URI')) {
echo('ATTENZIONE: la lunghezza di «'.$dom.'» eccede quella del campo URI della tabella Instances, perciò lo ignoro.');
} else {
echo('Provo a recuperare le informazioni API sullistanza ... ');
if ($buf['cont']!==false) {
if (is_array($info)) {
echo('OK :-)'.N);
echo('Provo a recuperare le informazioni Nodeinfo sullistanza ... ');
if ($buf['cont']!==false) {
echo('OK :-)'.N);
// teniamo d'occhio le notifiche di cui sotto per includere eventualmente altri derivati di mastodon?
// visti fin qui, verificare cosa sono: epicyon
if (isset($info['x-nodeinfo']['software']['name']) && !is_null($info['x-nodeinfo']['software']['name'])) {
if (preg_match('/^mastodon|corgidon/',$info['x-nodeinfo']['software']['name'])===1)
$res=mysqli_query($link,'SELECT Name FROM Platforms WHERE Name=\''.myesc($link,$info['x-nodeinfo']['software']['name']).'\'')
or mexit(__LINE__.': '.mysqli_error($link).N,3);
if (mysqli_num_rows($res)<1) {
if (!$opts['dryrun']) mysqli_query($link,'INSERT INTO Platforms (Name) VALUES (\''.myesc($link,truncs($info['x-nodeinfo']['software']['name'],'Platforms','Name','«'.$info['uri'].'»')).'\')')
or mexit(__LINE__.': '.mysqli_error($link).N,3);
notify('«'.$info['uri'].'» utilizza come software «'.$info['x-nodeinfo']['software']['name'].'»; lho aggiunto alla tabella delle piattaforme incontrate. Se non si tratta di mastodon o corgidon, che già vengono accettati, sarebbe buona cosa verificare se è una variante di mastodon e quanto è compatibile, per valutare se accettare le istanze che lo utilizzano.',1);
} else {
echo('ERRORE: '.$buf['emsg'].N);
if (array_key_exists('version',$info)) {
if ($info['version']>='2.1.2') {
echo('Provo a recuperare le informazioni API sullattività dellistanza ... ');
if ($buf['cont']!==false) {
echo('OK :-)'.N);
} else {
echo('ERRORE: '.$buf['emsg'].N);
if ($info['version']>='3.0.0') {
echo('Provo a recuperare le informazioni API sui trends dellistanza ... ');
if ($buf['cont']!==false) {
echo('OK :-)'.N);
} else {
echo('ERRORE: '.$buf['emsg'].N);
} else {
echo('ERRORE: i dati recuperati non erano un array'.N);
} else {
echo('ERRORE: '.$buf['emsg'].N);
if (!isset($info['uri']) || preg_match('#^\s*$#',$info['uri'])===1)
if (is_array($info) && count($info)>0) {
//echo('Dumpone json di tutte le info recuperate:'.N.json_encode($info,JSON_PRETTY_PRINT).N);
if ($opts['jsonwrite'])
fwrite($jsonf,'"'.$dom.'": '.json_encode($info,JSON_PRETTY_PRINT).','.N);
if (!$instans) {
// questo è il limbo delle istanze che non rispondono
$res=mysqli_query($link,'SELECT * FROM Instances WHERE URI=\''.myesc($link,$dom).'\'')
or mexit(__LINE__.': '.mysqli_error($link).N,3);
if (mysqli_num_rows($res)>0) {
echo('«'.$dom.'» non risponde, ma è presente nel database; aggiorno InstChecks, Instances.LastCheckOk ed eventualmente Instances.Dead.'.N);
if (!$opts['dryrun']) mysqli_query($link,'INSERT INTO InstChecks (InstID, Time, Status) VALUES ('.$row['ID'].', '.$now.', 0)')
or mexit(__LINE__.': '.mysqli_error($link).N,3);
if (!$opts['dryrun']) mysqli_query($link,'UPDATE Instances SET LastCheckOk=0 WHERE ID='.$row['ID'])
or mexit(__LINE__.': '.mysqli_error($link).N,3);
// vediamo se ha mai risposto e nel caso ritorniamo per primo il momento dell'ultima risposta
$rres=mysqli_query($link,'SELECT Time FROM InstChecks WHERE InstID='.$row['ID'].' AND Status=1 ORDER BY Time DESC') or mexit(__LINE__.': '.mysqli_error($link).N,3);
// se non ha mai risposto ritorniamo per primo il momento del primo check
if (mysqli_num_rows($rres)==0) {
$rres=mysqli_query($link,'SELECT Time FROM InstChecks WHERE InstID='.$row['ID'].' AND Status=0 ORDER BY Time ASC') or mexit(__LINE__.': '.mysqli_error($link).N,3);
if (mysqli_num_rows($rres)>0) {
if ($now-$rrow['Time']>$opts['deadline']) {
if (!$opts['dryrun']) mysqli_query($link,'UPDATE Instances SET Dead=1 WHERE ID='.$row['ID'])
or mexit(__LINE__.': '.mysqli_error($link).N,3);
notify('Listanza «<a href="viewinst.php?id='.$row['ID'].'">'.$row['URI'].'</a>» è MORTA!',0);
} else {
echo('PAZZESCO! «'.$dom.'» esiste nel database ma non ci sono dati relativi in InstChecks! Rimedio.'.N);
if (!$opts['dryrun']) mysqli_query($link,'INSERT INTO InstChecks SET InstID='.$row['ID'].', Time='.$now.', Status=0')
or mexit(__LINE__.': '.mysqli_error($link).N,3);
} else {
echo('«'.$dom.'» non risponde e non è nel database, la aggiungo.'.N);
(array_key_exists($dom,$blacklist)) ? $black='1' : $black='0';
// "New=0" e nessun FirstSeen (quindi NULL) perché non è nuova e non è vista per la prima volta finché non risponde la prima volta
if (!$opts['dryrun']) {
mysqli_query($link,'INSERT INTO Instances SET New=0, Good=0, Chosen=0, Visible=0, Blacklisted='.$black.', URI=\''.myesc($link,$dom).'\', LastCheckOk=0') or mexit(__LINE__.': '.mysqli_error($link).N,3);
mysqli_query($link,'INSERT INTO InstChecks SET InstID='.$instid.', Time='.$now.', Status=0') or mexit(__LINE__.': '.mysqli_error($link).N,3);
} else {
} else {
// l'istanza ha risposto occhei...
if (is_null($ismast)) {
if (!array_key_exists('version',$info)) {
$ismast=null;// ridondante, ma tanto per metterci qualcosa
} elseif (array_key_exists('pleroma',$info)) {
} elseif (preg_match('#(compatible|pleroma|pixelfed)#i',$info['version'])==1) {
} elseif (preg_match('#^[0-9]+\.[0-9]+\.[0-9]+#',$info['version'])!==1) {
} else {
if (!is_null($ismast))
($ismast) ? $ismast=1 : $ismast=0;
$instrow=array('ID'=>null, 'FirstSeen'=>null, 'IsMastodon'=>$ismast, 'Dead'=>0, 'New'=>0, 'Good'=>0, 'Chosen'=>0, 'Priority'=>null, 'Visible'=>0, 'Blacklisted'=>0, 'URI'=>null, 'Title'=>null, 'ShortDesc'=>null, 'LongDesc'=>null, 'OurDesc'=>null, 'OurDescEN'=> null, 'LocalityID'=>null, 'OurLangsLock'=>0, 'Email'=>null, 'Software'=>null, 'Version'=>null, 'UserCount'=>null, 'StatusCount'=>null, 'DomainCount'=>null, 'ActiveUsersMonth'=>null, 'ActiveUsersHalfYear'=>null, 'Thumb'=>null, 'RegOpen'=>null, 'RegReqApproval'=>null, 'MaxTootChars'=>null, 'AdmAccount'=>null, 'AdmDisplayName'=>null, 'AdmCreatedAt'=>null, 'AdmNote'=>null, 'AdmURL'=>null, 'AdmAvatar'=>null, 'AdmHeader'=>null, 'LastCheckOk'=>1, 'GuestID'=>null, 'LastGuestEdit'=>null);
if (array_key_exists($info['uri'],$blacklist))
if (akeavinn('title',$info))
if (akeavinn('short_description',$info))
if (akeavinn('description',$info))
if (akeavinn('email',$info))
if (akeavinn('version',$info))
if (akeavinn('stats',$info)) {
if (akeavinn('user_count',$info['stats']))
if (akeavinn('status_count',$info['stats']))
if (akeavinn('domain_count',$info['stats']))
if (akeavinn('thumbnail',$info))
if (akeavinn('max_toot_chars',$info))
if (akeavinn('registrations',$info))
$instrow['RegOpen']=b2i($info['registrations'],'Istanza «'.$instrow['URI'].'»: ');
if (akeavinn('approval_required',$info))
$instrow['RegReqApproval']=b2i($info['approval_required'],'Istanza «'.$instrow['URI'].'»: ');
if (akeavinn('contact_account',$info)) {
if (akeavinn('acct',$info['contact_account']))
if (akeavinn('display_name',$info['contact_account']))
if (akeavinn('created_at',$info['contact_account']))
if (akeavinn('note',$info['contact_account']))
if (akeavinn('url',$info['contact_account']))
if (akeavinn('avatar',$info['contact_account']))
if (akeavinn('header',$info['contact_account']))
if (akeavinn('x-nodeinfo',$info)) {
if (akeavinn('software',$info['x-nodeinfo']) && akeavinn('name',$info['x-nodeinfo']['software']))
if (akeavinn('usage',$info['x-nodeinfo']) && akeavinn('users',$info['x-nodeinfo']['usage'])) {
if (akeavinn('activeMonth',$info['x-nodeinfo']['usage']['users']))
if (akeavinn('activeHalfyear',$info['x-nodeinfo']['usage']['users']))
if ($instrow['Blacklisted']==1)
$whynot[]='è nella blacklist';
if (is_null($instrow['RegOpen'])) {
$whynot[]='non se ne conosce lo stato delle registrazioni (aperte/chiuse)';
} elseif ($instrow['RegOpen']==0) {
$whynot[]='ha le registrazioni chiuse';
if (is_null($instrow['UserCount'])) {
$whynot[]='non se ne conosce il numero di utenti';
} elseif ($instrow['UserCount']<10 || $instrow['UserCount']>30000) {
$whynot[]='il numero di utenti non è compreso tra 10 e 30.000';
if (is_null($instrow['DomainCount'])) {
$whynot[]='non se ne conosce il numero di istanze note';
} elseif ($instrow['DomainCount']<500) {
$whynot[]='il numero di istanze note è minore di 500';
if (!is_null($instrow['ActiveUsersMonth'])) {
if ($instrow['ActiveUsersMonth']<10)
$whynot[]='il numero di utenti attivi nellultimo mese è minore di 10';
} elseif (!is_null($instrow['StatusCount']) && $instrow['UserCount']>0 && $instrow['StatusCount']/$instrow['UserCount']<10) {
$whynot[]='il numero medio di toots per utente è minore di 10';
} else {
$whynot[]='è stato impossibile determinare il numero di utenti attivi nellultimo mese o il numero medio di toots per utente';
if (count($whynot)==0) {
echo('Siamo in presenza di unistanza BUONA! :-)'.N);
} else {
echo('Siamo in presenza di unistanza CATTIVA: '.implode('; ',$whynot).' :-('.N);
$res=mysqli_query($link,'SELECT * FROM Instances WHERE URI=\''.myesc($link,$instrow['URI']).'\'')
or mexit(__LINE__.': '.mysqli_error($link).N,3);
if (mysqli_num_rows($res)>0) {
echo('«'.$instrow['URI'].'» è già presente nel DB, la aggiorno...'.N);
// se l'istanza già presente nel db ha FirstSeen=NULL significa che è stata aggiunta senza che rispondesse e che questa è la prima volta che risponde, quindi...
if (is_null($oldinstrow['FirstSeen'])) {
} else {
if ($instrow['Good']==1 && $oldinstrow['Good']==0) {
notify('Listanza «<a href="viewinst.php?id='.$instrow['ID'].'">'.$instrow['URI'].'</a>» non era papabile, ma lo è diventata!',1);
} elseif ($instrow['Good']==0 && $oldinstrow['Good']==1) {
notify('Listanza «<a href="viewinst.php?id='.$instrow['ID'].'">'.$instrow['URI'].'</a>» era papabile, ma non lo è più per i seguenti motivi: '.implode('; ',$whynot),3);
if ($instrow['ShortDesc']!=$oldinstrow['ShortDesc'])
notify('La «Descrizione breve» dellistanza «<a href="viewinst.php?id='.$instrow['ID'].'">'.$instrow['URI'].'</a>» è cambiata.',2);
if ($instrow['LongDesc']!=$oldinstrow['LongDesc'])
notify('La «Descrizione lunga» dellistanza «<a href="viewinst.php?id='.$instrow['ID'].'">'.$instrow['URI'].'</a>» è cambiata.',2);
$query='UPDATE Instances SET ';
foreach ($instrow as $field=>$value) {
if (!is_null($value))
$query.=$field.'=\''.myesc($link,$value).'\', ';
$query.=$field.'=NULL, ';
$query=substr($query,0,-2).' WHERE Instances.ID='.$instrow['ID'];
echo('QUERONA DI UPDATE: «'.$query.'».'.N);
if (!$opts['dryrun']) mysqli_query($link,$query)
or mexit(__LINE__.': '.mysqli_error($link).N,3);
$res=mysqli_query($link,'SELECT InstID, LangID, Pos, Code FROM InstLangs LEFT JOIN Languages ON Languages.ID=LangID WHERE InstID='.$instrow['ID'].' ORDER BY Pos ASC')
or mexit(__LINE__.': '.mysqli_error($link).N,3);
while ($row=mysqli_fetch_assoc($res))
$instlangs=langs($instrow['ID'], $instrow['URI'], false);
if ($instlangs!=$oldinstlangs) {
notify('La lista delle lingue utilizzate dichiarate dallistanza «<a href="viewinst.php?id='.$instrow['ID'].'">'.$instrow['URI'].'</a>» è cambiata da «'.subarimp(', ','Code',$oldinstlangs).'» a «'.subarimp(', ','Code',$instlangs).'».',2);
if (!$opts['dryrun']) mysqli_query($link,'DELETE FROM InstLangs WHERE InstID='.$instrow['ID'])
or mexit(__LINE__.': '.mysqli_error($link).N,3);
foreach ($instlangs as $row) {
if (!$opts['dryrun']) mysqli_query($link,'INSERT INTO InstLangs (InstID, LangID, Pos) VALUES ('.$row['InstID'].', '.$row['LangID'].', '.$row['Pos'].')')
or mexit(__LINE__.': '.mysqli_error($link).N,3);
if ($instrow['OurLangsLock']==0) {
$instourlangs=langs($instrow['ID'], $instrow['URI'], true);
// se instourlangs è vuoto e instlangs no, imposta instourlangs come instlangs
if (count($instourlangs)==0 && count($instlangs)>0)
if (count($instourlangs)>0) {
if (!$opts['dryrun']) mysqli_query($link,'DELETE FROM InstOurLangs WHERE InstID='.$instrow['ID'])
or mexit(__LINE__.': '.mysqli_error($link).N,3);
foreach ($instourlangs as $row) {
if (!$opts['dryrun']) mysqli_query($link,'INSERT INTO InstOurLangs (InstID, OurLangID, Pos) VALUES ('.$row['InstID'].', '.$row['LangID'].', '.$row['Pos'].')')
or mexit(__LINE__.': '.mysqli_error($link).N,3);
} else {
echo('«'.$info['uri'].'» non è già presente nel DB, la aggiungo...'.N);
if ($opts['setnew'])
foreach ($instrow as $field=>$value) {
if (!is_null($value))
$values.='\''.myesc($link,$value).'\', ';
$values.='NULL, ';
$query='INSERT INTO Instances ('.implode(', ',$fields).') VALUES ('.$values.')';
echo('QUERONA DI INSERT: «'.$query.'»'.N);
if (!$opts['dryrun']) {
mysqli_query($link,$query) or mexit(__LINE__.': '.mysqli_error($link).N,3);
} else {
if ($opts['setnew'])
notify('Ho trovato una nuova istanza: «<a href="viewinst.php?id='.$instid.'">'.$instrow['URI'].'</a>».',1);
$instlangs=langs($instid, $instrow['URI'], false);
foreach ($instlangs as $row) {
if (!$opts['dryrun']) mysqli_query($link,'INSERT INTO InstLangs (InstID, LangID, Pos) VALUES ('.$row['InstID'].', '.$row['LangID'].', '.$row['Pos'].')')
or mexit(__LINE__.': '.mysqli_error($link).N,3);
$instourlangs=langs($instid, $instrow['URI'], true);
// se instourlangs è vuoto e instlangs no, imposta instourlangs come instlangs
if (count($instourlangs)==0 && count($instlangs)>0)
foreach ($instourlangs as $row) {
if (!$opts['dryrun']) mysqli_query($link,'INSERT INTO InstOurLangs (InstID, OurLangID, Pos) VALUES ('.$row['InstID'].', '.$row['LangID'].', '.$row['Pos'].')')
or mexit(__LINE__.': '.mysqli_error($link).N,3);
if ($instrow['Good']==1)
notify('La nuova istanza «<a href="viewinst.php?id='.$instid.'">'.$instrow['URI'].'</a>» è papabile!',1);
if (array_key_exists('x-activity',$info) && is_array($info['x-activity'])) {
if (!$opts['dryrun']) mysqli_query($link,'DELETE FROM InstActivity WHERE InstID='.$instid);
foreach ($info['x-activity'] as $buf) {
if (akeavinn('week',$buf) && akeavinn('statuses',$buf) && akeavinn('logins',$buf) && akeavinn('registrations',$buf)) {
$query='INSERT INTO InstActivity (InstID, Week, Statuses, Logins, Registrations, Pos) VALUES (\''.$instid.'\', \''.myesc($link,$buf['week']).'\', \''.myesc($link,$buf['statuses']).'\', \''.myesc($link,$buf['logins']).'\', \''.myesc($link,$buf['registrations']).'\', '.$pos.')';
if (!$opts['dryrun']) mysqli_query($link,$query)
or mexit(__LINE__.': '.mysqli_error($link).N,3);
if (array_key_exists('x-trends',$info) && is_array($info['x-trends'])) {
foreach ($info['x-trends'] as $buf) {
if (akeavinn('name',$buf) && akeavinn('url',$buf) && akeavinn('history',$buf) && is_array($buf['history'])) {
foreach ($buf['history'] as $row) {
if ($row['uses']>0)
if (!$opts['dryrun']) mysqli_query($link,'DELETE FROM InstTrends WHERE InstID='.$instid);
foreach ($trends as $trend) {
$query='INSERT INTO InstTrends (InstID, LastDay, Name, URL, Pos) VALUES ('.$trend['InstID'].', \''.$trend['LastDay'].'\', \''.myesc($link,truncs($trend['Name'],'InstTrends','Name','«'.$instrow['URI'].'»')).'\', \''.myesc($link,truncs($trend['URL'],'InstTrends','URL','«'.$instrow['URI'].'»')).'\', '.$pos.')';
if (!$opts['dryrun']) mysqli_query($link,$query)
or mexit(__LINE__.': '.mysqli_error($link).N,3);
if (!$opts['dryrun']) mysqli_query($link,'INSERT INTO InstChecks (InstID, Time, Status) VALUES ('.$instid.', '.$now.', 1)')
or mexit(__LINE__.': '.mysqli_error($link).N,3);
if ($opts['jsonwrite']) {
fwrite($jsonf,'"Fine?": true'.N.'}'.N);