Pour finir la semaine, nous publions une nouvelle bêta du plug-in qui devrait corriger quelques problèmes signalés par les bêta testeurs. La recherche textuelle est en place. Certains PDF ont des textes illisibles associés, nos robots sont en train de corriger cela, mais cela va prendre du temps. Nous allons passer du statut de bêta privé à bêta publique par une annonce en ce sens sur le Forum. Pour répondre à certaines observations formulées dans les commentaires, la recherche avancée se fera sur une page séparée bien qu'il sera également possible d'entrer des commandes dans le champ texte. La grande différence de la recherche textuelle tel que le propose Kooplet est qu'elle se fait également dans les fichiers musicaux, on peut, par exemple, retrouver un morceau si on connait les paroles de la chanson mais que l'on a oublié le titre. |
|
|
by Didier Guillion | | |
| |
|
La recherche de texte est maintenant complètement opérationnelle. Comme prévu, des mots spéciaux, terminés par un deux-points ( : ) permettent de la configurer de manière fine: partout: ou anywhere: Recherche les mots suivants n'importe où dans le fichier. C'est le mode opératoire par défaut. paroles: ou lyrics: Recherche les mots suivants dans les paroles des chansons autre: ou other: Recherche les mots suivants n'importe où, sauf dans les paroles des chansons site: Restreint la recherche à la liste de sites qui suit. (ex. myriad-users.com cpdl.org) type: Restreint la recherche à la liste des types de fichiers qui suit. (ex. pdf myr ) Les mots à rechercher sont séparés par des espaces si on veut qu'ils soient recherchés dans n'importe quel ordre et qu'ils peuvent être séparés par d'autre mots, ou entre guillemets si on désire les chercher dans l'ordre, et consécutifs. Nous en avons également profité pour retraiter les 1600 fichiers PDF déjà dans la base, afin de prendre en compte plus de textes extraits par PDFtoMusic. Cela a permis d'améliorer les résultats de recherche textuelle sur ce type de fichiers. Je rappelle le lien provisoire: http://www.kooplet.com/main.html |
|
|
by Olivier Guillion | | |
| |
|
En fin de semaine dernière, un ancien client nous re-contacte pour nous demander une réactualisation éventuelle de deux applications que nous avions développé pour lui en... 1996 ! Durant la période 1992-1998 nous avons travaillé sur plusieurs logiciels techniques pour le Conseil Supérieur de la Pêche et la division Etude et Recherche d'EDF. Ces logiciels gravitaient sur le thème des passes à poissons et des débits de rivière. Les logiciels en question sont Cassiopée et Moulinet. Conçus à la base sur Windows 3.1, ils tournent encore quotidiennement sur le terrain. Mais si on veut les recompiler, maintenant, il faut retrouver les fichiers sources... Un après midi est passé à explorer les sauvegardes que nous avons sous la main, une bonne centaine de CD couvrant la période 2002-2009. Chou blanc. Dernier espoir, les très anciennes archives que nous gardons dans un grenier. Nous rapatrions 30 bons kilos de CD, nous en avons plus de 1000, la tâche semble titanesque. Mais, grosse question, 14 ans après, les CD seront ils encore lisibles ? Pour le vérifier, nous en prenons un au hasard, une archive de 1998. Il se monte. Parmi les dossiers très anciens, (Harmony 2.0 par exemple), un dossier "Dodge", nous nous rappelons, c'était le nom provisoire du projet. Fébrile, on l'ouvre, et là, tous les fichiers sources, soigneusement alignés et parfaitement lisibles. Mince de coup de bol ! Saint Isidore de Séville était avec nous ! |
|
|
by Didier Guillion | | |
| |
|
Aujourd'hui Melody Player et Plug-In : correction d'un problème de transposition. Harmony : Correction d'un artefact graphique dans la table de mixage complète. Des problèmes ont été rapportés sur le mode de fonctionnement Kooplet du plug-in, ils ont été corrigés. Enfin, nous sommes en train d'implémenter la recherche textuelle dans les partitions tandis que nos robots continuent à collecter des documents, nous en sommes à 52 000. |
|
|
by Didier Guillion | | | |
|
Alors que la base de données de Kooplet est proche d'atteindre la barre des 50000 fichiers, nous avons travaillé sur la recherche de texte, qui devrait être mise en place très prochainement. On pourra effectuer soit des recherches simples, comme par exemple: fugue Bach pour trouver tous les morceaux qui contiennent, n'importe où dans leur texte, les deux mots "fugue" et "Bach", soit des recherches complexes, comme celle-ci: paroles: Domine "in excelsis" autre: bach partout: orgue type: pdf site: superpartitions.net Cette recherche listera les fichiers satisfaisant à tous ces critères : - Contient le mot "Domine" et le couple de mots "in excelsis" dans ses paroles - Contient le mot "Bach" dans ses textes autres que des paroles (titre, compositeur, remarques, noms de portées...) - Contient le mot "orgue" n'importe où dans ses textes (paroles ou non) - Le type du fichier est PDF - Le site sur lequel est le fichier est "superpartitions.net" - et, bien entendu, si une séquence musicale a été entrée dans le plug-in, le fichier doit également la contenir. De telles recherches, même complexes, s'avèrent relativement rapides, donc cela ne devrait pas nécessiter des prouesses de programmation pour mettre en place ce nouveau module. |
|
|
by Olivier Guillion | | | |
|
Ca y est ! Une première version du moteur de recherche mélodique, Kooplet est ouverte au bêta test. Pour l'instant la recherche de texte n'est pas opérationnelle mais on peut déjà chercher des mélodies. Bien sur, il faudra installer la dernière version du plug-in et se connecter à l'adresse : http://www.kooplet.com/main.html Nos ordinateurs travaillent à fond pour compléter la base qui référence déjà 26 000 documents. Tout rapport, positif ou négatif est le bienvenu ! |
|
|
by Didier Guillion | | |
| |
|
On s'approche peu à peu du but. Les programmes de construction et maintenance de la base de données ainsi que ceux qui permettent la recherche par l'utilisateur étaient jusqu'ici testés en local, sur les ordinateurs de chez nous. Ils ont maintenant été transférés sur le serveur distant (www.kooplet.com) mais sont encore sur une page cachée, inaccessible au public. Nous avons effacé les 30000 morceaux de la base de données et avons recommencé une collecte depuis le départ. En effet, nos divers tests avaient émaillé les données d'enregistrements incomplets ou abîmés, nous préférons donc repartir sur des bases saines. Nous allons faire tourner le "crawler" cette nuit, afin de constituer une collection suffiamment importante pour permettre aux utilisateurs de tester tout cela, une fois que la dernière version du plug-in aura été diffusée en beta (ce qui ne saurait tarder). |
|
|
by Olivier Guillion | | | |
|
On trouve sur certains sites des partitions archivées en .zip. Ce peut être pour deux raisons, soit le format de fichier n'est pas lui-même compacté, soit plusieurs fichiers sont fournis simultanément. Kooplet traite maintenant les .zip qui sont décomposés en autant de fichiers indépendants. La recherche pourra donc se faire à l'intérieur des archives. Il reste à traiter le problème particulier du format ABC puisque ce format permet par défaut de faire une collection de musique en un seul fichier. |
|
|
by Didier Guillion | | | |
|
Le piano virtuel réagit maintenant comme le manche de guitare virtuel, quand rien ne se joue et qu'une sélection ponctuelle est positionné sur la partition, les notes correspondantes sont affichées sur le piano. Ceci permet aux débutants de déchiffrer pas à pas les accords. La recherche via Kooplet commence à donner des résultats assez amusants. Quand on recherche des thèmes populaires comme "Au clair de la lune" ou "Ah ! vous dirais je maman." on les retrouve tel quel dans le Carnaval des Animaux, de Camille Saint Saëns, cela ne doit pas étonner les musicologues, mais nous on trouve cela marrant ! Nous espérons pouvoir ouvrir le système aux premiers bêta testeur très très bientôt même si cela restera limité dans un premier temps à des recherches mélodiques (sans rythme et sans texte). |
|
|
by Didier Guillion | | |
| |
|
La recherche fonctionne maintenant correctement. La recherche de textes (nom de l'oeuvre ou du compositeur, mots dans les paroles, etc) n'est pas encore écrite, mais ce ne devrait pas être le plus difficile. Après avoir "séché" un petit moment sur un bug dans notre version du Perl sur PC, pourtant absent de la même version de Perl sur Linux, nous avons écrit les opérations de maintenance en tâche de fond de la base de données. En effet, il ne suffit pas de parcourir le web pour collecter des informations sur les musiques trouvées, encore faut-il faire le "ménage", en vérifiant que ces musiques sont toujours présentes en ligne, et en compactant la base de données de temps en temps, lorsqu'un nombre suffisant de liens brisés a ainsi été découvert et éliminé. Même si tout n'est pas encore finalisé, nous avons bon espoir de proposer très bientôt une préversion du plug-in incluant le module de recherche, ainsi qu'une première version de la page d'accueil de Kooplet. |
|
|
by Olivier Guillion | | | |
|
Aujourd'hui nous avons corrigées de petites irrégularités sur Harmony et quasiment finalisé la prochaine version de l'importateur NoteWorthy. Notre logiciel de création de didacticiels vidéo MMBuilder a été recompilé sur Macintosh, cela n'avait pas été fait depuis 2008. Enfin, la recherche Kooplet a été optimisée en vitesse. Sur la même base de donnée, nous sommes passés de 18 à 1 seconde, ce qui correspond à nos objectifs actuels. Voici une capture du plug-in en action : Bien sur ce n'est qu'un design provisoire ! |
|
|
by Didier Guillion | | |
| |
|
Nous avons passé la journée à optimiser et accélérer les recherches mélodiques dans la base de données. Cela a porté sur trois points principaux: - L'utilisation, dans le langage que nous utilisons (Perl), de fonctions rapides. Pour le même travail, la vitesse peut être multipliée par 10 selon la manière dont on s'y prend. - La création de tables d'index, permettant des accès rapides à notre base - La création de "hash-tables", qui permettent, lorsqu'une recherche de mélodie est demandée, d'éliminer très rapidement une très grosse proportion des musiques dans lesquelles on n'a aucune chance de retrouver la mélodie en question. Nous avons ainsi pu diminuer les temps de recherche de 80%. Nous nous sommes ensuite attaqués à la réduction de la taille de la base de données, qui prenait trop rapidement des dimensions considérables (plusieurs centaines de méga-octets). Un simple petit compactage "maison" des enregistrements a déjà permis de la réduire de 75%. Si ce n'est pas suffisant, il faudra alors voir si on peut réduire la quantité de données dont nous avons besoin pour chaque morceau. |
|
|
by Olivier Guillion | | | |
|
Nous nous sommes rendu compte que les utilisateurs Windows ne pouvaient changer la langue de l'interface une fois Melody Player lancé comme c'était possible sur Macintosh. Une nouvelle option a donc été ajouté dans la configuration. Nous avons maintenant une petite liste de points à corriger et à améliorer dans l'importateur NoteWorthy, une nouvelle version est en chantier. Parallèlement à ceci, nous cherchons maintenant à améliorer la vitesse de la recherche des séquences mélodique, pour l'instant il faut environ 18 secondes pour obtenir un résultat, ce qui est long. L'idéal serait de tomber en dessous des 4 secondes. C'est donc notre nouvel objectif. Enfin, en dernier mais non des moindres, nous avons créé un domaine spécifique pour la recherche de séquence mélodique. C'est : www.kooplet.com |
|
|
by Didier Guillion | | | |
|
Les problèmes de l'étape 14 ont été résolus, et nous disposons donc maintenant d'une version du plug-in interrogeable en Javascript, sur tous les navigateurs que nous ayons pu tester. Nous pouvons permettre ainsi à la page Web d'interroger le plug-in pour connaitre son état actuel, la séquence rentrée, les options cochées, etc. Pour la petite histoire, le problème avec IE a été résolu après quelques heures à patauger par un simple redémarrage de la machine. Apparemment, Windows avait on ne sait comment conservé l'ancienne version du programme et s'obstinait à l'utiliser à la place de notre nouvelle mouture. Donc nous avons mis en place une version plus complète de la page de recherche et avons commencé les tests et optimisations. L'utilisation d'encodage simplifié des mélodies, comme le "Parsons", semble de moins en moins judicieux au fur et à mesure que la taille de la base de données des musiques augmente. Avec une recherche sur 230000 portées, la recherche exacte donne presque toujours des résultats, et y ajouter quelques dizaines de milliers de résultats approximatifs ne nous semble pas vraiment utile. |
|
|
by Olivier Guillion | | |
| |
|
Aujourd'hui : Correction de la gestion des caractères "espace" dans PDFtoMusic. Correction de la sélection de notes en tablatures prioritaires dans Harmony. Mais aussi : Nous nous sommes enfin mis d'accord pour le nom de notre système de recherche, nous allons déposer un nom de site et une fois que ce sera fait, nous pourrons en parler... |
|
|
by Didier Guillion | | | |
|
Nous avons réussi à mettre en place la communication entre le plug-in et la page Web qui l'accueille. Ceci permet de récupérer, la séquence à rechercher lorsque l'utilisateur clique le bouton "Rechercher" de la page. Ce n'est donc plus le plug-in qui demande la recherche, nous autorisant une plus grande flexibilité et des mises à jour faciles. Malheureusement, si la méthode employée fonctionne sur tous les navigateurs Mac, et, sous Windows, sur Firefox, Opera, etc, elle ne fonctionne pas -qui l'eût cru- sur Internet Explorer. Sur Internet explorer en effet, les plug-ins sont des "objets ActiveX", technologie privée de chez Microsoft. Nous avions donc il y a quelque temps, créé un petit objet ActiveX servant de passerelle vers notre plug-in. Mais cet objet ne permet pas les fonctions avancées de contrôle du plug-in par la page Web. Nous essayons donc de mettre en place une communication entre l'objet ActiveX et la page Web, pour ensuite relayer ces communications vers le plug-in. Et c'est vraiment "galère"... |
|
|
by Olivier Guillion | | |
| |
|
La journée a été passée à essayer de trouver une solution au problème rencontré à l'étape 12. Apparemment notre questionnement était légitime puisque la fondation Mozilla a implémenté en 2004 un jeu de nouvelles fonctions qui permettent par exemple d'interroger un plug-in en JavaScript. Nous l'avons testé sur Mac (Safari et FireFox) et cela fonctionne. La partie PC est en cours. Donc, voici comment cela va être mis en place : l'utilisateur définit par exemple une séquence de notes dans le plugin, et clique sur un bouton de la page web. Un code JavaScript est lancé qui demande au plugin son état actuel et construit la requête sous forme d'une URL, envoyée à notre serveur. A noter que l'inverse était également possible : le plugin pourrait interroger les différents objets de la page web pour connaître leurs valeurs. Mais la solution choisie est plus simple, ajouter une nouvelle option de recherche ne demande qu'à modifier la page web sans avoir à publier une nouvelle version du plugin. |
|
|
by Didier Guillion | | | |
|
Bon, là, nous sommes tombés sur un os dans le pâté... Rappelons que les bases de données que nous créons contiennent non seulement les notes mais aussi plein d'autres informations comme les annotations, les paroles, les instruments, etc. Nous voudrions que l'utilisateur puisse lancer une recherche via une requête du genre : telle séquence de note, mais uniquement dans les musiques contenant le mot "Bach". Concrètement, nous nous trouvons avec une page HTML où le plugin permet de saisir la séquence et un champs texte d'entrer les mots à rechercher. Comment envoyer ces deux types d'informations simultanément au script de recherche ? Le plugin peut il accéder au texte saisi ? Une routine Javascript peut elle interroger le plugin ? Pour l'instant nous pataugeons allègrement dans différentes solutions qui sont soit obsolètes, soit non compatibles entre les différents navigateurs. Il va falloir ruser. |
|
|
by Didier Guillion | | |
| |
|
Le robot a tourné pendant 24 heures, et a collecté jusqu'ici environ 15000 fichiers musicaux, contenant 80000 portées. La base de donnée prend rapidement de l'ampleur (250 Mo), et il faudra que nous trouvions un moyen de la réduire sans pénaliser la rapidité de recherche. Pour l'instant, les résultats de recherche donnent ce type de renseignements (la présentation n'est pas définitive): On a donc, pour chaque fichier: - La pertinence. Plus le nombre est élevé, plus le résultat trouvé est conforme à ce que l'on cherchait - Le type de fichier et son nom ou titre - Si disponible, le nom du compositeur - Si disponibles, les remarques - Le numéro et le nom de la portée dans laquelle la séquence a été trouvée, le numéro de mesure, et un petit bouton pour jouer la séquence trouvée - La page d'origine qui présente le fichier |
|
|
by Olivier Guillion | | | |
|
Ce week-end nous avons lancé notre "crawler" sur une liste de sites, espérant trouver une belle base de donnée ce matin. Las, il a planté dans la nuit de Vendredi. Nous avons corrigé le problème et allons le relancer cette nuit. Le coté plug-in commence a être bien au point. Dans nos cartons nous avons des idées pour améliorer la saisie. En effet, certaines personnes, ne connaissant pas le solfège serons peut être rebutées par l'entrée de notes, bien qu'il soit possible d'écouter la séquence. Pourquoi ne pas imaginer qu'en mode recherche de rythme, on puisse tapoter la barre d'espace pour définir la séquence ? Ou qu'en mode recherche de fréquence, on siffle la mélodie à rechercher dans le microphone ? |
|
|
by Didier Guillion | | |
| |
|
|