ECM libre : retour d'expérience sur Alfresco et Nuxeo

par Louis Roché - le 25/09/2011 - dans informatiquelinuxlibreECMGEDAlfrescoNuxeo - avec 5 commentaire(s)

Actuellement en stage, j'ai du trouver une solution pour regrouper la documentation de plusieurs pôles de R&D dans ma boite. Ces pôles R&D sont dispersés dans plusieurs villes et ne respectent pas une norme commune pour nommer, stocker et consulter leurs documents.

Les dépôts utilisés par l'entreprise sont des dossiers partagés Windows (CIFS), des dépôts CVS, des sites web en HTML statique, une instance d'Alfresco et des forums. Ils ne sont pas hébergés sur un unique serveur, mais dispersés au sein de chacun des pôles de l'entreprise qui alimente leurs dépôts à sa façon sans ce soucier du fonctionnement des autres pôles.

La solution à trouver devait permettre :

  • d'indexer le contenu de tous ces dépôts
  • d'y faire des recherches
  • de gérer des droits d'accès sur les documents
  • de versionner les documents à chaque mise à jour
  • de récupérer régulièrement les nouvelles versions des documents sur les anciens dépôts qui ne sont pas destinés à mourir à court terme.

J'ai donc fait des recherches sur les différentes méthodes qui existaient et qui pouvaient répondre à mes besoins.

Il n'y a finalement pas des millions de manières de stocker et indexer des documents, surtout si on veut que leur contenu soit lui aussi indexé, et encore moins de solutions qui permettent de faire ça sans avoir à modifier en profondeur le mode de fonctionnent actuel.

Je vous donne quant même les différentes solutions que j'ai regardées mais pas retenu :

  • Google Docs et Office 365. Ces logiciels ont plusieurs problèmes assez importants. Ils sont chers, nécessitent de transférer tous les documents, ne supportent pas tous les types de formats et surtout font perdre le contrôle des documents. On parle ici des documents de la R&D, il n'est pas question de permettre à n'importe qui d'accéder à ces informations.
  • Google desktop. Mais il compliqué de mettre en place des recherches sur des ordinateurs distants tout en respectant des droits d'accès précis. Il est aussi impossible d'indexer les dépôts CVS.
  • Sharepoint contient dans ses dernières versions des fonctionnalités de GED. Mais le logiciel est cher.
  • eXo platform, Knowledge Tree, Maarch, Jahia... Ce sont tous des logiciels de GED libres. Ces logiciels n'ont pas été retenus, soit parce que des fonctionnalités importantes sont absentes, soit ils présentent des problèmes rédhibitoires (intégration avec la suite office, accès par CIFS, FTP, WEBDAV impossible, extensions hors de prix, suite complète trop importante et recouvrant des besoins inexistants). Ces logiciels sont tout de même intéressants. Je retiens surtout eXo platform qui est une suite d'outils qui peuvent former l'intranet d'une société.

Finalement, à l'issue de ces recherches, je me suis retrouvé avec Alfresco et Nuxeo. J'ai donc monté une VM pour chacun des logiciels et j'ai commencé à expérimenter. C'est la première fois que j'utilise des logiciel de GED et plus précisément d'ECM dans ce cas. J'ai découvert les possibilités et les limites peu à peu, au fil de mes tests.

Alfresco est le produit d'anciens de documentum (gros logiciel d'ECM propriétaire et totalement hors de prix). Il est assez récent et écrit en Java. Deux versions sont proposées. Une Open Source qui sort régulièrement et une livrée avec un support (payante donc) et qui intègre rapidement les correctifs ou les évolutions. Je travaille moi avec la version communautaire Open Source.

Nuxeo est un produit plus ancien qui à été réécrit en 2007 en Java. Il est édité par une société française. Il a une communauté francophone plutôt active. Contrairement à Alfresco, il y a une unique version Open Source. Les produits vendus sont des logiciels pour personnaliser l'interface ou du support.

Concernant l'interface utilisateur, Nuxeo est clairement plus simple à prendre en main. L'interface fonctionne par onglet, est claire et bien organisée. Elle dispose aussi de fonctionnalités intéressantes comme le clic droit. Alfresco a deux interfaces. Une ancienne assez laide, lente, peu intuitive, difficile à personnaliser. Et une nouvelle qui est plus claire, qui rajoute de nombreuses fonctionnalités, mais n'est pas plus simple à prendre en main.

Les deux logiciels peuvent utiliser Lucene pour indexer les documents et y faire des recherches. Pas de différence sur cette fonctionnalité. Il semble tout de même plus facile de changer de moteur avec Nuxeo qu'avec Alfresco. Il semble que lucene soit vraiment très intégré dans Alfresco et qu'il est presque impossible de s'en défaire totalement.

Pour les communautés (important pour voir si un outil ne risque pas de disparaitre du jour au lendemain), Alfresco en a une plus importante mais essentiellement anglophone. La communauté francophone est très limitée. C'est plutôt l'inverse pour Nuxeo. Je pense que les deux logiciels sont promis à un bel avenir et qu'il n'y a pas de soucis à se faire de ce côté.

Jusque là, j'ai donc tendance à préférer Nuxeo. Surtout du fait à son interface.

Mais Alfresco fait la différence sur un point important : il est possible d'accéder aux documents de beaucoup plus de façons. Alfresco supporte le CIFS, le webdav (avec les fonctionnalités de versionning, blocage des documents pour ne pas avoir deux éditions simultanées), le CMIS et le FTP. Nuxeo ne supporte que le CMIS et le webdav.

Je dois pouvoir importer et récupérer facilement des documents sur le logiciel pour les synchronisés avec les dépôts documentaires. La disponibilité du CIFS est donc un gros plus (surtout sur Windows). J'ai donc choisi d'utiliser alfresco et j'en suis plutôt content. Il y a tout de même un certain nombre de problèmes :

  • Le dossier dans lequel vous faites une recherche n'est pas indiqué dans l'interface de recherche. Si jamais vous êtes trop bas dans l’arborescence et que vous avez oublié votre localisation, vous êtes obligés de revenir dans l'entrepôt, remonter dans l'arborescence et relancer une recherche.
  • Il est possible de suivre les nouveautés dans un dossier grâce à un flux RSS, mais ce n'est pas recursif. Il faut donc ajouter un grand nombre de flux pour suivre toute une arborescence.
  • Le tableau de bord (interface d'accueil) n'est pas très clair. Il est utile surtout si vous utilisez les sites (équivalent des sites sharepoint avec blog, wiki, forums, calendriers...). Mais sinon il est plutôt lent à charger et les informations affichées ne sont pas forcément à jour (je pense au widget qui affiche les informations sur nos documents verrouillés par exemple).
  • Le Webdav rajoute une nouvelle version du document à chaque fois qu'on enregistre. C'est donc viable sur de petite modifications. Mais si l'on souhaite éditer une grosse partie d'un document avec des sauvegardes intermédiaires, il faut forcément le télécharger depuis l'interface web plutôt que travailler avec le webdav.
  • Le CIFS est horrible à mettre en place sur un serveur windows.
  • L'export et l'import ne sont pas d'une grande simplicité.

Sinon le logiciel est vraiment intéressant. Il y a quelques fonctionnalitée très sympathiques :

  • Suivi d'un document avec alertes mails
  • Possibilité de créer des tags et des catégories pour chaque document. Il est donc possible de créer une arborescence secondaire avec les catégories en plus de l’arborescence physique affichée classiquement.
  • La recherche est vraiment puissante et rapide, même sur un nombre important de documents (plus de 10go).
  • Support du LDAP.
  • Gestion des droits tout à fait suffisante.
  • Workflows puissants et (relativement) faciles à mettre en place.

Bon nombre de ces points sont aussi valables avec nuxeo.

Finalement, ce que je regrette le plus avec ces deux logiciels, surtout avec alfresco, c'est que malgré le côté opensource, il est compliqué de se mettre dans le code. La doc est complète, les aides nombreuses, mais cela reste quelque chose de très complexe. Pour vraiment personnaliser le logiciel en profondeur, il faut vraiment y passer beaucoup de temps, au moins au début.

Par contre, si on commence à utiliser ce genre d'outil, il devient difficile de s'en passer. Il est tout de suite beaucoup plus facile d'avoir un suivi de la documentation, de retrouver les informations que l'on cherche et de modifier les workflow de validation qu'en faisant tout ça à la main.

Je reviendrai surement à nouveau sur Alfresco dans de prochains billets pour préciser certains points techniques précis.

MPD pour écouter sa musique... quand ça fonctionne

par Louis Roché - le 31/03/2011 - dans informatiquelinuxserveurmusique - avec 6 commentaire(s)

Ça fait environ 2 ans que j'utilise exclusivement MPD pour écouter ma musique. J'aime beaucoup ce logiciel parce qu'il est léger, fonctionnel, rapide, très stable et qu'il peut se contrôler depuis divers client. Lors de ma première installation, j'avais créé un fichier de configuration très basique qui fonctionne toujours.

Il y a peu, j'ai installé MPD sur un nouvel ordinateur. Sachant que pour configurer le logiciel à l'époque il m'avait fallu 3 minutes, je me suis lancé tête baissée en supposant que tout allait fonctionner de base. J'ai donc tenté de reprendre l'exemple de fichier de configuration fourni pendant l'installation. Totalement illisible, bourré d'option dont je ne comprends pas l'utilité, des lignes de conf perdues au milieu de paragraphes de commentaires, il faut bien du courage pour arriver à quelque chose de fonctionnel. Et malgré tous mes efforts, je ne suis arrivé à rien. Alors je me suis finalement décidé à reprendre le fichier de conf d'époque.

Il semble que je fasse exactement tout ce que déconseille le site de MPD : lancer le logiciel en user simple, avoir tous ses fichiers de configuration dans son home et ne toucher à rien pendant des années. Néanmoins, je peux écouter ma musique et je pense que c'est ce qui m'importe le plus.

Donc afin de vous éviter de possibles moments d'arrachage de cheveux ou de briser vous enceintes de rage, je partage avec vous mon fichier de config tout pas beau et à ne surtout pas reproduire. Il doit normalement fonctionner si vous lancez MPD depuis votre utilisateur simple, que vous placez votre mpdconf dans votre home en fichier caché et que vous utilisez alsa. Par la suite, il faudra surtout ne toucher à rien jusqu'à la mort de votre ordinateur sous peine de voir le dieu de la config cassée vous maudire à vie. Avouez que ce serait bête.

À noter tout de même un petit problème. Jusqu'alors, pour lancer ncmpcpp, il me suffisait de taper 'ncmpcpp' dans un terminal et la connexion se faisait d'elle même. Il me faut maintenant préciser le port.

PS: Vous vous en doutez, ce message est en fait un appel à l'aide caché. Si vous comprennez comment fonctionne ce satanné logiciel, je suis preneur.

#################################################################################
# Fichiers et dossiers :
#
music_directory "~/music" # Là où se trouve la musique
playlist_directory "~/music/playlists" # Où mettre les playlists
db_file "~/music/.mpd.db" # La base de données
log_file "~/.mpd.log" # fichier de log
#error_file "~/.mpd-error.log" # fichier de log des erreurs
pid_file "~/.mpd.pid" # fichier PID
#################################################################################
#################################################################################
# Connexion (facultatif) :
#
port "6600"
#################################################################################
#################################################################################
# Authentification (facultatif) :
# Si vous voulez contrôler l'accès au serveur (facultatif)
# Si l'option password n'est pas spécifiée, alors les personnes non authentifiées
# auront le droit de tout faire
#
#password abc@read,add,control,admin # Autorise la personne qui utilise le mot de
# passe abc a tout faire.
default_permissions "read,add,control,admin" # Autorise les personnes non authentifiées
# en lecture uniquement.
#################################################################################
audio_output {
 type "alsa"
 name "Myequal"
 #device "equal"
}

J'ai rapporté internet à la maison

par Louis Roché - le 05/03/2011 - dans informatiqueinternetlibrelinuxserveur - avec 13 commentaire(s)

Mon cadeau de noël à moi c'était un sheevaplug. Ces miniserveurs qui tiennent sur une prise de courant, consomment peu et ne font pas de bruit. Passé quelques problèmes de douanes et la découverte du bidule, je suis véritablement séduit. J'ai maintenant un serveur chez moi, qui fait tourner une forge, mes clients de communication (irc, minbif...), un ou deux wiki et un serveur jabber. J'espère bientôt pouvoir rajouter des sites et les mails. L'ensemble fonctionne avec une debian testing et a l'air de très bien se porter pour le moment.

Certes, l'intérêt du produit peu sembler assez faible, surtout qu'il est à un prix non négligeable. Mais je suis un idéaliste, et c'est comme un bon petit jouet qui m'amuse. J'avais précédemment des ordinateurs de récupération qui effectuaient cette tache. Outre leur faible puissance et leur stockage ridicule, le plus gros problème était le bruit. Quand on décide de faire tourner un ordinateur 24/7, il faut vraiment prendre en compte ce problème, surtout quand on vit en studio.

Je n'ai vraiment pas fais de choix extravagant dessus, je suis resté sur des choses que je maitrise plutôt bien. Et même si le serveur est un arm, le fait d'avoir debian permet de disposer d'un très grand nombre de paquets. Les compilations sont aussi possible. Le processeur ne tourne qu'à 1,2 Ghz mais c'est suffisant tant qu'on ne tente pas l'opération avec KDE ou LibreOffice.

D'un point de vu technique, pour moi le plus gros problème est l'espace de stockage. De base, l'engin ne dispose que de 500mo, qui d'ailleurs ne sont pas forcément accessible selon l'OS installé. J'ai donc du prendre un carte SD de 16go, et j'ai toujours le port USB de libre pour éventuellement rajouter un disque dur. Mais ce serait dommage de rajouter une extension au boitier et de détruire son côté compact.

Niveau OS, j'étais au départ lancé sur un FreeBSD. Mais l'installation est plutôt musclée pour les premières fois. Sachant que tout le matériel, dont le lecteur de carte mémoire, n'est pas reconnu directement. J'ai donc suivi un guide plutôt bien foutu qui donne les étapes pas à pas pour l'installation d'une debian. Je tenterai peut être une nouvelle transition le jour ou j'aurais tout cassé.

Pour le débit, je n'ai pas vraiment de problème. Le serveur sert beaucoup sur le réseau local où tout passe en Ethernet. Et vers l'extérieur, les 5mega en up de ma connexion sont pour le moment suffisant. Mais je n'héberge rien de très consommateur ou ayant 200000 visiteurs par jours.

Maintenant que je n'ai plus peur de tout casser et que je ne partage plus mes serveurs avec des colocataires, je vais pouvoir me lancer dans des expériences techniques. Sous peu, je devrais donc avoir un serveur DNS perso, un ftp pseudo publique, un moyen simple d'upload des fichiers et un serveur de diffusion de musique. Des services essentiellement privé en somme, mais maintenant accessible de partout. Peut-être même y héberger tous mes services publiques. Mais je préfère garder une partie de mes services sur des serveurs qui ne dépendent pas de ma connexion personnelle.

Je conseil vraiment l'expérience à tous ceux qui voudraient faire des expérimentations, de nouvelles découverte, et apprendre pas mal de chose en gestion de serveur. Le meilleur moyen d'apprendre reste la pratique. Et savoir que tout fonctionne depuis chez nous est encore une plus grande satisfaction.

Découvertes libres

par Louis Roché - le 01/09/2010 - dans liensinformatiqueinternetlibre - avec 0 commentaire(s)

Aujourd'hui, j'ai envie de revenir sur quelques découvertes libres que j'ai fait ces derniers temps. Rien au top de l'actualité, rien qui risque de changer le monde, mais des petites choses plaisantes et intéressants.

Cette première découverte est Osmo. Un logiciel qui fait à la fois calendrier (mon utilisation principale), notes, taches et contacts. Jusqu'à présent j'utilisais un logiciel différent pour chacune de ces activités. Je n'aime pas les usines à gaz. Mais Osmo est assez léger et bien fait pour que je fasse le changement. Il y a juste pour les contacts ou j'ai gardé mes vieilles habitudes. Ils sont encore sur Thunderbird.

Radio Tray est un petit logiciel qui, comme son nom l'indique, permet d'écouter la radio. Je ne parle pas de radio FM mais des webradio. Vous avez juste à rajouter les flux de vos radios favorites et elles seront ensuite toujours à portée de main. Je suis particulièrement séduit qu'on puisse tout gérer depuis l'icone dans le tray. Pas d'interface avec des options aussi compliquées qu'inutiles alourdissant le logiciel. Ici c'est la simplicité et l'efficacité qui est de mise.

Pour rester dans la musique, voici Musopen. Le site à pour projet d'enregistrer des oeuvres tombées dans le domaine public tout en n'appliquant pas de copyright aux enregistrements. Vous pouvez ainsi en faire ce que vous voulez. En effet, bien que de nombreux morceaux soient tombés dans le domaine public, les enregistrements eux sont toujours protégés grâce au droit voisin. Vous ne pouvez donc pas retoucher, modifier ou partager les enregistrement que vous acheter. Le site se concentre sur la musique classique car c'est un des rares domaines ou beaucoup d'oeuvres sont tombées dans le domaine public.
Musopen est d'ailleurs en train de faire un appel aux dons pour recruter un orchestre international afin d'enregistrer des shymponies de Beethoven, Brahms, Sibelius et Tchaikovsky.

Je suis de ceux qui pensent qu'il faut éduquer pour faire avancer le libre. Éduquer par et pour le libre. Dans cette optique, le projet OOo4Kids est très intéressant. C'est une refonte du logiciel openoffice destinée aux enfants de sept à douze ans. A l'occasion de la sortie de la version 1.0, ils ont fait une courte vidéo de présentation que je vous invite à voir.

Toujours dans les vidéos, l'association Ilico (qui vient de devenir un FAI) a regroupée sur une page 6 heures de vidéos de Benjamin Bayart. Ces vidéos ont pour ambition de présenter internet à tout un chacun. D'ailleurs la technique n'est pas le sujet plus important, Benjamin bayart réussissant très bien à la vulgariser pour se concentrer sur les enjeux d'internet. Toutes ces vidéos sont visibles sans player flash (html5) et sont disponibles au téléchargement.

Pour revenir à quelque chose de plus léger, voici MeMaker. Il semble que ce soit la mode en ce moment d'avoir un avatar qui nous ressemble dans un style manga. MeMaker, qui n'est pas bien compliqué, vous permet de créer un avatar en assemblant divers morceaux de tête (yeux, bouches, cheveux...). Ce n'est pas une révolution, mais il fait ça très bien et les résultats sont sympathiques.

Liens de la semaine #5

par Louis Roché - le 07/08/2010 - dans liensinformatiqueinternetliensdelasemaine - avec 0 commentaire(s)

La "navigation privée" des navigateurs n'est pas fiable à 100 % : Utilisation différente de la navigation privée selon les navigateurs et faiblesses de ces modes.

L'Hadopi va-t-elle cibler certains FAI plus que d'autres ? : Le filtrage, nouvelle poule aux oeufs d'or pour les FAI ?

L'Inde prête à porter plainte à l'OMC contre l'ACTA : La révolte du sud.

Je suis devenu ce que je suis en bidouillant : Exécuter n’importe quoi qui, bordel, puisse s’exécuter.

Hackers and Painters

Plugging the WikiLeak: What can the government do? : The vast nature of the Internet, however, makes it essentially impossible to stop something, or take it down, once it has gone out over multiple servers.

40 milliardaires américains prêts à donner la moitié de leur fortune : Bill Gates, fondateur de Microsoft, et Warren Buffett, patron du fonds Berkshire, sont à l'origine de cet inédit tour de table. 

WikiLeaks s'offre une assurance vie cryptée : Le site détient-il une nouvelle bombe ou fait-il du bluff ?

Marketing de surveillance : le prochain buzzword ? : Que pen­ser d’un monde où vos acti­vi­tés sont sur­veillées en per­ma­nence afin non seule­ment d’ «assu­rer la pro­tec­tion» des citoyens mais égale­ment pour don­ner sa pleine dimen­sion à une nou­velle forme de mar­ke­ting, qui per­met­tra de mieux vous cibler ?

Les dangers du géotagging : Il convient de poin­ter de poten­tiels usages qu’il serait bon d’appréhender au plus vite si l’on veut pou­voir les abor­der avec un mini­mum de sérénité.

Le FBI s’en prend à Wikipedia pour une histoire de logo : L’encyclopédie en ligne est accusée de reproduire illégalement le logo du FBI dans l’article qu’elle consacre à l’organisation. Wikimedia ne compte pas céder.

Wikileaks remplace-t-il la presse en Afghanistan ? : Le Guardian démontre qu’il existe encore une véri­table place pour une presse qui sait se réinventer.

Tout ce que vous devez savoir sur Internet en 9 points : Comment voulez-vous que les gens adhèrent aux mouvements de défense de la neutralité du Net si ils ne comprennent même pas ce qu’est le Net ?

Le journalisme selon Hunter S. Thompson : Je n’ai pas encore trouvé de dope qui puisse vous faire monter aussi haut qu’être assis à un bureau à écrire

Google et Verizon seraient sur le point de s’entendre pour abandonner la Neutralité du Net : Une neutralité compromise est elle vraiment neutre ?

Hadopi : le recours déposé par FDN est enfin transmis aux parties adverses : Le Ministère de la Culture, le Secrétariat Général du Gouvernement et la Hadopi ont deux mois pour présenter leur mémoire en réponse.

page 1 sur 7 | suivante > | >>