Le sujet d’un de mes derniers billets sur les problèmes juridiques rencontrés par Eric avec Fuzz.fr m’a permis de continuer à réfléchir à cette complexité pour un service qui tient son intérêt dans sa capacité à sélectionner les bonnes sources d’information à agréger mais qu’une fois ces informations indexées et présentées sur le site, leur contenu peut être sujet à produire des soucis que quelqu’un comme moi qui maintien son petit service dans son coin et de façon bénévole, en tant qu’hobby, ne pourra pas assumer si ils arrivaient. Dans ce cas, quoi faire ? Continuer avec cette épée de Damoclès au dessus de la tête et attendre les emmerdements ? Non merci, cela aurait été un beau gâchis d’énergie. Alors oui, peut-être prendre la décision maintenant de faire autre chose, tel que je l’ai déjà plusieurs fois écrit ici au cours de ces deux dernières années. Transformer Xoolyx en quelques chose d’un peu différent mais toujours proche du contenu d’information. Je ne sais pas encore totalement qu’elle forme cela prendra. Alors non, s’il existe un jour Xoolyx Marmot ne sera plus la simple évolution fonctionnelle de Xoolyx.fr. Le service n’agrégera plus massivement de l’information en provenance de sources susceptibles de poser des problèmes un jour au l’autre. Depuis maintenant quelques minutes Xoolyx.fr est donc mis en standby, le service étant uniquement accessible via ses flux RSS qui de toute façon répercutent tous les billets et articles agrégés par le service. Il faut savoir prendre les bonnes décisions au bon moment et assumer ce que l’on décidera. Je vous remercie donc par avance pour votre compréhension et surtout restez informés sur l’évolution que prendra Xoolyx.fr en continuant à lire mon petit blog à moi.

Bookmark and Share
Comme vous avez déjà pu le lire, ces derniers jours LesPipoles.com, Wikio et Fuzz ont eu tous les trois droit à des procédures juridiques pour avoir indexés et relayés des articles concernant l’actualité people de personnalités du cinéma tout simplement parce ces sites ont récupéré et affiché des données issues de l’agrégation des flux RSS ou simplement bookmarkées par de simples utilisateurs de ces services. A mon niveau à moi, avec Xoolyx, j’ai bien conscience d’être tout autant exposé, peut-être à la nuance près que mon service ne cherche pas à générer des revenus par l’exposition publique de l’information. Pour éviter tout risques et ennuis que je ne serais pas capable de supporter, j’ai décidé de faire simple. J’ai ainsi désactivé toutes les sources d’information concernant l’actualité people ainsi que tous les articles indexés qui en sont issus, que ce soit dans la base de données ou dans le moteur d’indexation/recherche. Tant pis, à quoi bon si certains ne comprennent pas qu’ils se trompent de cible en emmerdant inutilement ceux qui ne fait de mal à personne. A part de passer pour des cons abrutis couillons, ils n’y trouveront rien d’autre.

A lire, sur le même sujet, la très bonne analyse de Philippe sur AccessOWeb.
Bookmark and Share

Xoolyx Marmot, c’est le petit nom de la prochaine version de Xoolyx. Pourquoi Marmot ? Parce que c’est en anglais et que cela donne un genre … anglo-saxon, ca fait plus riche. Ensuite, tout simplement pace que « … la marmotte, elle met le chocolat dans le papier d'alu... ». Une façon simple de dire qu’il y a des choses impossibles à réaliser, sauf pour ceux qui voient la réalité autrement, avec un peu plus de poésie, de rêve et de romantisme. Pour certains de mon entourage cela pourrait aussi rappeler quelques souvenirs et un clin d’œil, à vous de les trouver.

Les grandes lignes des évolutions de Xoolyx Marmot ? Non, ce n’est pas top secret :
  • Une nouvelle interface plus sobre, plus puissante, en Flash (avec Abobe Flex pour les initiés)
  • La fonctionnalité de lecteur RSS intégré, là parce que j’en ai un peu raz le bol des disfonctionnements de Netvibes
  • L’indexation des vidéos, dans un premier temps sur le monde high-tech, d’autres catégories ensuite
  • Plus de blogs indexés et la différenciation entre les blogs des blogueurs et les sites web d’information
  • Et plein d’autres choses puisque rien n’est encore définitif
Voici déjà une capture d’écran brute de pressage de ce qui pourrait être l’interface de Xoolyx Marmot (pour le bleu de la barre de navigation, c'est provisoire, ce n’est qu'un hommage à mes amis d’en face).



Aller, on se fait la pub de Milka, juste pour raviver quelques souvenirs :



Il y a même un site de fan : http://www.marmotte.net/milka
Bookmark and Share


J’ai effectué aujourd’hui le petit nettoyage régulier des articles et billets indexés dans Xoolyx.fr, le service d’information basé sur l’aggrégation de sites web et blogs. J’ai donc supprimé tous les articles antérieurs au 15 octobre 2007, soit plus de 260 000 articles et billets. Ce nettoyage fait passer le nombre des articles et billets de plus de 837 000 à un peu plus de 577 000 articles ayant moins de 5 mois d’ancienneté. Pour ceux qui aiment la technique, cette suppression dans la base de données a durée plus de 21 minutes et la ré-indexation des documents avec Apache Lucene s’est effectuée en 10 minutes. A noter que suis passé de Lucene 2.0 à Lucene 2.3.1. Le temps d’indexation avec cette dernière version s’est donc significativement réduit.

Toujours un constat, après plus de deux ans d’indexation des blogs, il n’est pas encore donné à tout le monde de produire un XML RSS valide. Pour la majorité des blogs qui utilisent des plateformes hébergées, logiciels libres ou Feedburner, pas de problème, tout va à peu près bien. Mais alors pour ce qui est des sites que l’on appelle des « grands médias », c’est souvent du n’importe quoi avec du XML bien souvent non valide, avec du contenu encodé n’importe comment. Alors pour ces flux RSS bousillés, Xoolyx n’indexe rien, du moins pendant la période ou le flux contient des erreurs, tant pis pour eux, ils n’ont qu’à faire un boulot correct.

J’en ai aussi profité pour bloquer tous les robots d’indexation qui passeraient sur Xoolyx, ceux de Google, Microsoft et Yahoo compris. Pas la peine de vous demander si je suis devenu fou. En moyenne les visiteurs d’un site web proviennent à 70% des moteurs de recherche, mais pour le coup les pages indexées de Xoolyx dans les principaux moteurs sont uniquement les liens de redirection vers les articles, les utilisateurs venant par là ne verront même pas apparaitre les pages de Xoolyx. Alors à quoi bon à part générer des faux votes (et oui, si vous allez faire un tour sur Xoolyx, vous verrez quasiment tous les articles se trouvant sur les pages principales sont votés. Une partie infime de ceux-ci sont réellement effectués par des vrais utilisateurs, ils sont le fait des méchants robots qui n’hésitent pas suivre les liens javascript), j’ai donc choisi de m’en passer.
Bookmark and Share
Bon, quand je vois ce qu’ils font en face, notamment chez Wikio Europa, je trouve que le look & feel de Xoolyx.fr ne va plus. A dire vrai j’étais fan du look sombre, il y a un peu moins de deux ans tout le monde en faisait. La version 1 de Xoolyx était bien moche. La version 2, celle qu’aujourd’hui (enfin, celle d’il y a 18 mois), a même failli plutôt ressembler à Yahoo New, avant que j’opte pour les couleurs plus foncés et flashy. Mais avec le temps qui passe, je me dis qu’il faut que je fasse quelque chose, quitter cette interface un peu trop multicolore pour quelque chose de plus sobre. Mais c’est vrai aussi que j’ai récemment décidé de changer la technologie de Xoolyx.fr pour passer en Adobe Flex avec une interface Flash, mais quand même tout en gardant une ergonomie générale proche du web. Les utilisateurs ne sont pas encore prêts pour des interfaces bling-bling, avec des bidules qui bougent dans tous les sens, je vais donc essayer de brider un peu ma créativité dans ce domaine.
Bookmark and Share
Un petit rappel, vous pouvez toujours proposer vos blogs pour qu’ils soient indexés dans Xoolyx. En voici la présentation « officielle » :

Xoolyx agrège les publications de plusieurs milliers de sites et blogs et les classe sous plus de 50 catégories et sous-catégories. La sélection des sites et blogs est effectuée en prenant en compte un certain nombre de critères de qualité tels que le niveau rédactionnel, la précision du sujet traité mais aussi la popularité. Afin de nous aider à améliorer la qualité de notre service en y intégrant des nouvelles sources d’informations, vous pouvez nous recommander tout blog ou site web, soit le votre soit ceux que vous lisez, en saisissant son URL dans la champ suivant. La seule contrainte que nous avons est que les informations fournies par les sites et blogs recommandés soient disponibles sous forme de flux RSS ou Atom.

Il vous suffit simplement d’aller à l'adresse http://www.xoolyx.fr/tools/add.jsp et de saisir l’URL de votre blog et éventuellement votre adresse électronique pour que nous puissions vous confirmer son ajout dés que celui-ci sera effectué.

Bookmark and Share
XoolyxDepuis que j’ai laissé deux oreilles dépasser chez le Kelblog de Pierre et l’AccessOWeb de Philippe, j’ai logiquement eu droit à un volume de visites sortant un peu de l’ordinaire sur Xoolyx.fr. Pour me pas décevoir tout de suite ces nouveaux arrivants, j’en ai profité pour faire quelques micro-retouches que j’avais depuis quelque temps en magasin. La page d’accueil change un peu. La nouvelle page qui vous accueille présente maintenant la page des news, avec les trois derniers articles que chaque catégorie principale. Au niveau de toutes les pages, la catégorie de documents « Vidéos » disparaît. En fait il n’y a jamais eu de vidéos indexées sur Xoolyx, du moins pas sur l’environnement de production. Les vidéos reviendront un peu plus tard, dans un Xoolyx Vidéos tout neuf, tout dédié. J’ai aussi supprimé la possibilité de commenter les articles, Cette fonctionnalité ne servait pas à grand-chose, a part occuper des spammeurs Ukrainiens et Russes. Suppression aussi de l’envoi des articles par courriel.

Au passage, je préviens quand même que si le service est un peu lent au début de chaque heure, cela est malheureusement normal. Le moteur d’indexation tourne justement dans cet intervalle et n’ayant qu’un seul serveur de production, son processeur ne peut pas tout faire en même temps.

Xoolyx
Bookmark and Share