array( 'name' => 'Feed', 'type' => 'list', 'values' => array( 'Les flux multi-magazines' => array( 'Les dernières actualités de Futura-Sciences' => 'actualites', 'Les dernières définitions de Futura-Sciences' => 'definitions', 'Les dernières photos de Futura-Sciences' => 'photos', 'Les dernières questions - réponses de Futura-Sciences' => 'questions-reponses', 'Les derniers dossiers de Futura-Sciences' => 'dossiers' ), 'Les flux Services' => array( 'Les cartes virtuelles de Futura-Sciences' => 'services/cartes-virtuelles', 'Les fonds d\'écran de Futura-Sciences' => 'services/fonds-ecran' ), 'Les flux Santé' => array( 'Les dernières actualités de Futura-Santé' => 'sante/actualites', 'Les dernières définitions de Futura-Santé' => 'sante/definitions', 'Les dernières questions-réponses de Futura-Santé' => 'sante/question-reponses', 'Les derniers dossiers de Futura-Santé' => 'sante/dossiers' ), 'Les flux High-Tech' => array( 'Les dernières actualités de Futura-High-Tech' => 'high-tech/actualites', 'Les dernières astuces de Futura-High-Tech' => 'high-tech/question-reponses', 'Les dernières définitions de Futura-High-Tech' => 'high-tech/definitions', 'Les derniers dossiers de Futura-High-Tech' => 'high-tech/dossiers' ), 'Les flux Espace' => array( 'Les dernières actualités de Futura-Espace' => 'espace/actualites', 'Les dernières définitions de Futura-Espace' => 'espace/definitions', 'Les dernières questions-réponses de Futura-Espace' => 'espace/question-reponses', 'Les derniers dossiers de Futura-Espace' => 'espace/dossiers' ), 'Les flux Environnement' => array( 'Les dernières actualités de Futura-Environnement' => 'environnement/actualites', 'Les dernières définitions de Futura-Environnement' => 'environnement/definitions', 'Les dernières questions-réponses de Futura-Environnement' => 'environnement/question-reponses', 'Les derniers dossiers de Futura-Environnement' => 'environnement/dossiers' ), 'Les flux Maison' => array( 'Les dernières actualités de Futura-Maison' => 'maison/actualites', 'Les dernières astuces de Futura-Maison' => 'maison/question-reponses', 'Les dernières définitions de Futura-Maison' => 'maison/definitions', 'Les derniers dossiers de Futura-Maison' => 'maison/dossiers' ), 'Les flux Nature' => array( 'Les dernières actualités de Futura-Nature' => 'nature/actualites', 'Les dernières définitions de Futura-Nature' => 'nature/definitions', 'Les dernières questions-réponses de Futura-Nature' => 'nature/question-reponses', 'Les derniers dossiers de Futura-Nature' => 'nature/dossiers' ), 'Les flux Terre' => array( 'Les dernières actualités de Futura-Terre' => 'terre/actualites', 'Les dernières définitions de Futura-Terre' => 'terre/definitions', 'Les dernières questions-réponses de Futura-Terre' => 'terre/question-reponses', 'Les derniers dossiers de Futura-Terre' => 'terre/dossiers' ), 'Les flux Matière' => array( 'Les dernières actualités de Futura-Matière' => 'matiere/actualites', 'Les dernières définitions de Futura-Matière' => 'matiere/definitions', 'Les dernières questions-réponses de Futura-Matière' => 'matiere/question-reponses', 'Les derniers dossiers de Futura-Matière' => 'matiere/dossiers' ), 'Les flux Mathématiques' => array( 'Les dernières actualités de Futura-Mathématiques' => 'mathematiques/actualites', 'Les derniers dossiers de Futura-Mathématiques' => 'mathematiques/dossiers' ) ) ) )); public function collectData(){ $url = self::URI . 'rss/' . $this->getInput('feed') . '.xml'; $this->collectExpandableDatas($url, 10); } protected function parseItem($newsItem){ $item = parent::parseItem($newsItem); $item['uri'] = str_replace('#xtor=RSS-8', '', $item['uri']); $article = getSimpleHTMLDOMCached($item['uri']) or returnServerError('Could not request Futura-Sciences: ' . $item['uri']); $item['content'] = $this->extractArticleContent($article); $author = $this->extractAuthor($article); $item['author'] = empty($author) ? $item['author'] : $author; return $item; } private function stripWithDelimiters($string, $start, $end){ while(strpos($string, $start) !== false) { $section_to_remove = substr($string, strpos($string, $start)); $section_to_remove = substr($section_to_remove, 0, strpos($section_to_remove, $end) + strlen($end)); $string = str_replace($section_to_remove, '', $string); } return $string; } private function stripRecursiveHTMLSection($string, $tag_name, $tag_start){ $open_tag = '<' . $tag_name; $close_tag = ''; $close_tag_length = strlen($close_tag); if(strpos($tag_start, $open_tag) === 0) { while(strpos($string, $tag_start) !== false) { $max_recursion = 100; $section_to_remove = null; $section_start = strpos($string, $tag_start); $search_offset = $section_start; do { $max_recursion--; $section_end = strpos($string, $close_tag, $search_offset); $search_offset = $section_end + $close_tag_length; $section_to_remove = substr($string, $section_start, $section_end - $section_start + $close_tag_length); $open_tag_count = substr_count($section_to_remove, $open_tag); $close_tag_count = substr_count($section_to_remove, $close_tag); } while ($open_tag_count > $close_tag_count && $max_recursion > 0); $string = str_replace($section_to_remove, '', $string); } } return $string; } private function extractArticleContent($article){ $contents = $article->find('section.article-text-classic', 0)->innertext; $headline = trim($article->find('p.description', 0)->plaintext); if(!empty($headline)) $headline = '

' . $headline . '

'; foreach (array( '
stripRecursiveHTMLSection($contents, 'div', $div_start); } $contents = $this->stripWithDelimiters($contents, '
'); $contents = $this->stripWithDelimiters($contents, '

'); $contents = $this->stripWithDelimiters($contents, 'fs:definition="', '"'); $contents = $this->stripWithDelimiters($contents, 'fs:xt:clicktype="', '"'); $contents = $this->stripWithDelimiters($contents, 'fs:xt:clickname="', '"'); $contents = $this->stripWithDelimiters($contents, '