diff --git a/ecrire/inc_index.php3 b/ecrire/inc_index.php3 index e522e6b490666577c7da7da7531b6522f0d6de1d..9cdb9033e7ef6a29f27839bd96204db99b3afbca 100644 --- a/ecrire/inc_index.php3 +++ b/ecrire/inc_index.php3 @@ -589,12 +589,15 @@ function effectuer_une_indexation($nombre_indexations = 1) { if (isset($INDEX_iteration_nb_maxi[$table])) $limit = min($limit,$INDEX_iteration_nb_maxi[$table]); + // indexer en priorite les '1' (a reindexer), ensuite les '' + // (statut d'indexation inconnu), enfin les 'idx' (ceux dont + // l'indexation a precedemment echoue, p. ex. a cause d'un timeout) foreach (array('1', '', 'idx') as $mode) { - $s = spip_query("SELECT $table_primary, idx FROM $table + $s = spip_query("SELECT $table_primary AS id FROM $table WHERE idx='$mode' AND $critere LIMIT $limit"); while ($t = spip_fetch_array($s)) { - $vu[$table] .= $t[0].", "; - indexer_objet($table, $t[0], $t[1]); + $vu[$table] .= $t['id'].", "; + indexer_objet($table, $t['id'], $mode); } if ($vu) break; } @@ -613,10 +616,8 @@ function executer_une_indexation_syndic() { } function creer_liste_indexation() { - $tables = liste_index_tables(); - while (list(,$table) = each($tables)) { + foreach (liste_index_tables() as $table) spip_query("UPDATE $table SET idx='1' WHERE idx!='non'"); - } } function purger_index() { diff --git a/ecrire/inc_syndic.php b/ecrire/inc_syndic.php index b127d69c5f81dcd79dfdb0808f7541c894935404..805a22a55f9549f5539e5b8706524d8f083b2401 100644 --- a/ecrire/inc_syndic.php +++ b/ecrire/inc_syndic.php @@ -118,6 +118,8 @@ function cdata_echappe_retour(&$table, &$echappe_cdata) { function analyser_backend($rss, $url_syndic='') { include_ecrire("inc_texte"); # pour couper() + $rss = pipeline('pre_syndication', $rss); + // Echapper les CDATA $echappe_cdata = array(); if (preg_match_all(',<!\[CDATA\[(.*)]]>,Uims', $rss, @@ -212,9 +214,16 @@ function analyser_backend($rss, $url_syndic='') { preg_match(',<date>([^<]*)<,Uims',$item,$match)) $la_date = my_strtotime($match[1]); - if ($la_date < time() - 365 * 24 * 3600 - OR $la_date > time() + 48 * 3600) - $la_date = time(); + // controle de validite de la date + // pour eviter qu'un backend errone passe toujours devant + // (note: ca pourrait etre defini site par site, mais ca risque d'etre + // plus lourd que vraiment utile) + if ($GLOBALS['controler_dates_rss']) { + if ($la_date < time() - 365 * 24 * 3600 + OR $la_date > time() + 48 * 3600) + $la_date = time(); + } + $data['date'] = $la_date; // Honorer le <lastbuilddate> en forcant la date @@ -483,14 +492,24 @@ function syndic_a_jour($now_id_syndic, $statut = 'off') { // http://www.w3.org/TR/NOTE-datetime function my_strtotime($la_date) { + // format complet if (preg_match( - ',^([0-9]+-[0-9]+-[0-9]+T[0-9]+:[0-9]+(:[0-9]+)?)(\.[0-9]+)?' + ',^([0-9]+-[0-9]+-[0-9]+[T ][0-9]+:[0-9]+(:[0-9]+)?)(\.[0-9]+)?' .'(Z|([-+][0-9][0-9]):[0-9]+)?$,', $la_date, $match)) { $la_date = str_replace("T", " ", $match[1])." GMT"; return strtotime($la_date) - intval($match[5]) * 3600; } + // YYYY + if (preg_match(',^([0-9][0-9][0-9][0-9])$,', $la_date, $match)) + return strtotime($match[1]."-01-01"); + + // YYYY-MM + if (preg_match(',^([0-9][0-9][0-9][0-9]-[0-9][0-9])$,', $la_date, $match)) + return strtotime($match[1]."-01"); + + // utiliser strtotime en dernier ressort $s = strtotime($la_date); if ($s > 0) return $s; diff --git a/ecrire/inc_version.php3 b/ecrire/inc_version.php3 index 49eb856156ddbddebe090c06e52ba75b041352d3..2ff816d4e2df079322151415db57d15601dd6002 100644 --- a/ecrire/inc_version.php3 +++ b/ecrire/inc_version.php3 @@ -158,6 +158,9 @@ $ortho_servers = array ('http://ortho.spip.net/ortho_serveur.php'); // Produire du TeX ou du MathML ? $traiter_math = 'tex'; +// Controler les dates des item dans les flux RSS ? +$controler_dates_rss = true; + // // Plugins @@ -171,6 +174,7 @@ $spip_pipeline = array( 'pre_propre' => '|extraire_multi', 'post_propre' => '', 'pre_indexation' => '', + 'pre_syndication' => '', 'post_syndication' => '' ); # la matrice standard (fichiers definissant les fonctions a inclure)