fichier = $filename;
}
/**
* Récupération du texte à indexer dans le fichier HTML
*/
public function get_text($filename) {
$fp = fopen($filename, "r");
while (!feof($fp)) {
$line = fgets($fp, 4096);
$texte .= $line;
}
fclose($fp);
//Traitement du texte
$result = array();
$result_style = array();
$texte = str_replace("\n", "", $texte);
$texte = str_replace("\r", "", $texte);
//On enlève les htmlentities
$texte = html_entity_decode($texte);
//On enlève les balises )", $texte, $result);
preg_match_all("(.*?)", $texte, $result_style);
$nb_results = count($result[0]);
for ($i = 0; $i < $nb_results; $i++) {
$texte = str_replace($result[0][$i], "", $texte);
}
$nb_results_style = count($result_style[0]);
for ($i = 0; $i < $nb_results_style; $i++) {
$texte = str_replace($result_style[0][$i], "", $texte);
}
//On enlève les tags
$texte_final = strip_tags($texte);
return $texte_final;
}
}
?>