Différences

Ci-dessous, les différences entre deux révisions de la page.

Lien vers cette vue comparative

Les deux révisions précédentes Révision précédente
Prochaine révision
Révision précédente
goldendict [Le 12/01/2023, 18:13]
94.238.12.29 [Installation du logiciel]
goldendict [Le 25/01/2023, 05:34] (Version actuelle)
94.238.12.29 [GoldenDict]
Ligne 6: Ligne 6:
 ====== GoldenDict ====== ====== GoldenDict ======
  
-**GoldenDict** est une interface permettant l'​utilisation de dictionnaires hors ligne et en ligne. Il permet la gestion simultanée de multiples dictionnaires.+**GoldenDict** est une interface permettant l'​utilisation de dictionnaires hors ligne et en ligne. Il permet la gestion simultanée de multiples dictionnaires ​ou contenus éducatifs.
  
-Il supporte de très nombreux formats ​de dictionnaire ​tels que :+Il supporte de très nombreux formats tels que :
   * les dictionnaires Babylon (BGL) ;   * les dictionnaires Babylon (BGL) ;
   * les dictionnaires StarDict ;   * les dictionnaires StarDict ;
   * les dictionnaires au format dict ;   * les dictionnaires au format dict ;
   * les dictionnaires ABBYY Lingvo ;   * les dictionnaires ABBYY Lingvo ;
-  * Wikipédia ​et le Wiktionary ​hors ligne (entiers ou partiels) au format ​zim.+  * les contenus au format zim, WikipédiaWiktionary, des sites archivés... ​(mais quelques bugs possibles avec ce format).
   ​   ​
 Et peut interroger en ligne Wikipédia ou le Wiktionary, et de nombreux dictionnaires. Ou tout site ayant une fonction recherche créant une URL adaptable.\\ Et peut interroger en ligne Wikipédia ou le Wiktionary, et de nombreux dictionnaires. Ou tout site ayant une fonction recherche créant une URL adaptable.\\
Ligne 20: Ligne 20:
  
 {{:​education:​goldendict_trusty.png?​350}} {{:​education:​goldendict_trusty.png?​350}}
 +
 ===== Installation ===== ===== Installation =====
  
-==== Installation du logiciel ==== 
  
-Pour installer ce logiciel, il suffit d'[[:​tutoriel:​comment_installer_un_paquet|installer le paquet]] **[[apt>goldendict]]**.+====Installation du logiciel==== 
 +Pour installer ce logiciel, il suffit d'​installer le paquet goldendict. ​ 
  
 +====Installation des dictionnaires ====
  
 <note warning>​Attention:​ <note warning>​Attention:​
-  * (Surtout si "HTTPS uniquement"​ est activé dans Paramètres?​) Certains liens en http(non-s) ​vers des dictionnaires ​peuvent sembler non accessibles dans Firefox (01/2023). Il faut effacer manuellement ​''​https deux-points slash slash'' ​(ou uniquement le s de httpsde l'URL puis relancer, ou si la page de présentation de site non sécurisé s'​affiche enfin, faire [Continuer vers le site HTTP]. +  * (Surtout si "HTTPS uniquement"​ est activé dans Paramètres?​) Certains liens vers des dictionnaires sont en http (non-s), et peuvent sembler non accessibles dans Firefox (01/2023). Il faut effacer manuellement ​%%https://%% (ou uniquement le s) dans le champ d'adresse ​puis relancer, ou si la page de présentation de site non sécurisé s'​affiche enfin, faire [Continuer vers le site HTTP]. 
-  * (Question.) ​Les licences ne sont pas toujours claires (?). Sur http://​download.huzheng.org (pour les dictionnaires de [[StarDict]],​ dont Wikipedia dit qu'il avait été [[https://​en.wikipedia.org/​wiki/​Stardict|"​removed from SourceForge due to copyright infringement reports"​]]) par exemple, certains dictionnaires semblent libres (GPL) ou "​gratuits"​ (?) (Free to use), et d'​autres (sans mention de licence) piratés? De même sur https://​polyglotte.tuxfamily.org/​doku.php?​id=donnees:​dicos_bilingues certaines licences indiquent un copyright? Comme "© Robert Truc"​. ​+  * Les licences ne sont pas toujours claires (?). Sur http://​download.huzheng.org (pour les dictionnaires de [[StarDict]],​ dont Wikipedia dit qu'il avait été [[https://​en.wikipedia.org/​wiki/​Stardict|"​removed from SourceForge due to copyright infringement reports"​]]) par exemple, certains dictionnaires semblent libres (GPL) ou "​gratuits"​ (?) (Free to use), et d'​autres (sans mention de licence) piratés? De même sur https://​polyglotte.tuxfamily.org/​doku.php?​id=donnees:​dicos_bilingues certaines licences indiquent un copyright? Comme "© Robert Truc".\\ [[https://​polyglotte.tuxfamily.org/​doku.php?​id=todo|Une page du site Polyglotte]] mène à [[https://​forum.ubuntu-fr.org/​viewtopic.php?​pid=2257629#​p2257629|un commentaire dans le forum Ubuntu-fr]]:​ "la diffusion de certains de ces dictionnaires n'​est-elle pas illégale ?" (sans réelle réponse).
 </​note>​ </​note>​
  
  
 De nombreux dictionnaires sont téléchargeables:​ De nombreux dictionnaires sont téléchargeables:​
-  * Sur le site du [[http://​polyglotte.tuxfamily.org/​doku.php?​id=donnees:​dicos_bilingues|polygotte]] (en 2023, dernière màj 2014).+  * Sur le site du [[http://​polyglotte.tuxfamily.org/​doku.php?​id=donnees:​dicos_bilingues|polygotte]] (en janvier ​2023, dernière màj 2014).
   * Sur la page des [[http://​download.huzheng.org/​|dictionnaires de StarDict]]. Nombreux dictionnaires de traduction ou autre.   * Sur la page des [[http://​download.huzheng.org/​|dictionnaires de StarDict]]. Nombreux dictionnaires de traduction ou autre.
   * Vous pouvez [[:​tutoriel:​comment_installer_un_paquet|installer le paquet]] **[[apt>​stardict-xmlittre]]** pour le français,   * Vous pouvez [[:​tutoriel:​comment_installer_un_paquet|installer le paquet]] **[[apt>​stardict-xmlittre]]** pour le français,
   * De très nombreux dictionnaires en de nombreuses langues sont disponibles sur les sites de [[https://​freedict.org/​downloads/#​dictionary-downloads|freedict]],​ choisissez votre langue dans le champ **Pick a language**.   * De très nombreux dictionnaires en de nombreuses langues sont disponibles sur les sites de [[https://​freedict.org/​downloads/#​dictionary-downloads|freedict]],​ choisissez votre langue dans le champ **Pick a language**.
-  * Goldendict lisant parfaitement le format BGL, vous pourrez télécharger des dictionnaires Babylon à partir de cette <​del>​[[http://​www.babylon.com/​gloss/​glossaries.php|page]]</​del>​.\\ Lien direct pour le dictionnaire Babylon [[http://​info.babylon.com/​glossaries/​4E5/​Babylon_French_English_diction.BGL| français/​anglais]],​ et pour [[http://​info.babylon.com/​glossaries/​387/​Babylon_English_French.BGL|l'​anglais/​français]].\\+  * Goldendict lisant parfaitement le format BGL, vous pourrez télécharger des dictionnaires Babylon à partir de cette <​del>​[[http://​www.babylon.com/​gloss/​glossaries.php|page]]</​del>​. Lien direct pour le dictionnaire Babylon [[http://​info.babylon.com/​glossaries/​4E5/​Babylon_French_English_diction.BGL| français/​anglais]],​ et pour [[http://​info.babylon.com/​glossaries/​387/​Babylon_English_French.BGL|l'​anglais/​français]].\\
   * Les Wiktionnaires,​ [[https://​library.kiwix.org/?​lang=eng&​category=wiktionary|ici en anglais]].\\ Attention, en particulier à but de traduction, ils ne sont souvent pas encore aussi complets qu'un "vrai dictionnaire"​ (à date de janvier 2023). Le Wiktionary français (Wiktionnaire) souffre de nombreux manques de définitions et de traductions.\\   * Les Wiktionnaires,​ [[https://​library.kiwix.org/?​lang=eng&​category=wiktionary|ici en anglais]].\\ Attention, en particulier à but de traduction, ils ne sont souvent pas encore aussi complets qu'un "vrai dictionnaire"​ (à date de janvier 2023). Le Wiktionary français (Wiktionnaire) souffre de nombreux manques de définitions et de traductions.\\
  
Ligne 46: Ligne 49:
 Attention pour les fichiers contenant des vidéos, Goldendict ne semble pas lire les vidéos des fichiers zim (01/2023), contrairement à [[:Kiwix]], auquel ces fichiers sont premièrement destinés. Attention pour les fichiers contenant des vidéos, Goldendict ne semble pas lire les vidéos des fichiers zim (01/2023), contrairement à [[:Kiwix]], auquel ces fichiers sont premièrement destinés.
  
-Téléchargez le dictonnaire ​et [[archivage|décompressez-le]] dans le [[#​Dictionnaires hors-ligne|dossier de dictionnaires]] de votre choix que vous indiquerez à Goldendict.\\+Téléchargez le dictionnaire ​et [[archivage|décompressez-le]] dans le [[#​Dictionnaires hors-ligne|dossier de dictionnaires]] de votre choix que vous indiquerez à Goldendict.\\
 Notes: Pour libérer de l'​espace,​ vous pouvez supprimer les archives d'​origine après leur décompression. Les fichiers zim n'ont pas besoin d'​être décompressés. Notes: Pour libérer de l'​espace,​ vous pouvez supprimer les archives d'​origine après leur décompression. Les fichiers zim n'ont pas besoin d'​être décompressés.
  
Ligne 63: Ligne 66:
 ====Indexation automatique.==== ====Indexation automatique.====
 Au scan d'un dossier contenant de nouveaux dictionnaires,​ deux index par fichier seront créés (souvent assez rapidement). Il servent à "​classer"​ les mots, pour aider GoldenDict à les trouver quand une requête est faite.\\ Au scan d'un dossier contenant de nouveaux dictionnaires,​ deux index par fichier seront créés (souvent assez rapidement). Il servent à "​classer"​ les mots, pour aider GoldenDict à les trouver quand une requête est faite.\\
-D'​abord un pour la recherche sur les titres. Puis, un de plus grande taille pour la "​recherche en texte intégral"​ ou "​recherche plein texte" ou "​full-text search",​ il est nécessaire à GoldenDict pour effectuer une recherche sur le contenu des pages, et non uniquement sur le titre d'un article.\\+D'​abord un pour la recherche sur les titres. Puis, un de plus grande taille pour la "​recherche en texte intégral"​ ou "​recherche plein texte" ou "​full-text search",​ il est nécessaire à GoldenDict pour effectuer une recherche sur le contenu des pages, et non uniquement sur leur titre.\\
 Les fichiers zim comportent souvent déjà cet index, mais [[Kiwix]] les lit, et non Goldendict (ni [[WebArchive]]),​ GoldenDict doit donc les recréer (il semble en fait convertir les index déjà présents et non les créer depuis le corps du fichier en lui-même). Selon la taille du fichier et les capacités de l'​ordinateur,​ cette étape peut prendre de moins d'une seconde à plusieurs heures. ​ Les fichiers zim comportent souvent déjà cet index, mais [[Kiwix]] les lit, et non Goldendict (ni [[WebArchive]]),​ GoldenDict doit donc les recréer (il semble en fait convertir les index déjà présents et non les créer depuis le corps du fichier en lui-même). Selon la taille du fichier et les capacités de l'​ordinateur,​ cette étape peut prendre de moins d'une seconde à plusieurs heures. ​
  
 <note warning> <note warning>
-__Risque ​d'​effacement des index créés.__\\+**Risque ​d'​effacement des index créés.**\\
  
-Un tel effacement non désiré est problématique surtout si c'est un fichier pour la "​recherche en texte intégral"​ qui a nécessité plusieurs heures.\\ +Un effacement non désiré est problématique surtout si c'est un fichier pour la "​recherche en texte intégral"​ qui a nécessité plusieurs heures.\\ 
-Au démarrage de GoldenDict, la présence des dictionnaires est vérifiée. Si ils sont absents, leurs index créés par GoldenDict sont supprimés automatiquement. Si cette absence vient d'un retrait ​volontaire, parce que ce dictionnaire ne vous convenait pas ou parce que vous avez installé une version plus récente, il n'y a pas de problème, Goldendict ainsi ne cherche pas dans un index qui ne mème à rien et cela libère de l'​espace disque.\\ +Au démarrage de GoldenDict, la présence des dictionnaires est vérifiée. Si ils sont absents, leurs index créés par GoldenDict sont supprimés automatiquement. Si cette absence vient d'une suppression ​volontaire, il n'y a pas de problème, Goldendict ainsi ne cherche pas dans un index qui ne mène à rien et cela libère de l'​espace disque.\\ 
-Mais d'​autres cas peuvent se présenter, par exemple votre fichier est sur une autre partition, et elle n'​était pas montée, ou bien pour raison x vous avez déplacé le fichier dans un dossier non indiqué à GoldenDict.\\ +Mais d'​autres cas peuvent se présenter, par exemple votre fichier est sur une autre partition, et elle n'​était pas montée, ou bien vous avez déplacé le fichier dans un dossier non indiqué à GoldenDict.\\ 
-Pour éviter ce problème, vous pouvez par exemple monter automatiquement au démarrage la partition où vous préférez mettre des dictionnaires,​ ou bien vous pouvez ​repérer l'​index juste après sa création et en faire une copie de sauvegarde, il sera le fichier ​**/​home/<​nom-d'utilisateur>/​.goldendict/​index/​xxxxxx_FTS** le plus récent.+Pour éviter ce problème, vous pouvez par exemple monter automatiquement au démarrage la partition où vous préférez mettre des dictionnaires, ou ne pas les y mettre, ou bien vous pouvez faire des copies ​de sauvegarde ​du dossier ​**/​home/<​nom-d-utilisateur>/​.goldendict/​index/​**, ou individuellement y repérer un index, juste après sa création il sera le fichier **xxxxxx_FTS** le plus récent.
 </​note>​ </​note>​
  
Ligne 81: Ligne 84:
  
 __Indexation très longue ou bloquée pour la fonction "texte intégral"​.__\\ __Indexation très longue ou bloquée pour la fonction "texte intégral"​.__\\
-Certains fichiers, en particulier de Wikipédia ou Wiktionary au format zim, peuvent dépasser 5 ou 20GB. La taille importante peut refléter le poids des images ou des vidéos, ce qui alors pourra poser moins de problèmes (si ce n'est que [[Kiwix]] lit les vidéos, mais pas GoldenDict). Mais si il résulte d'un grand nombre de mots à indexer, l'​ordinateur aura un travail d'​autant plus important à fournir.\\+Certains fichiers, en particulier de Wikipédia ou Wiktionary au format zim, peuvent dépasser 5 ou 20GB. La taille importante peut juste refléter le poids des images ou des vidéos, mais si il résulte d'un grand nombre de mots à indexer, l'​ordinateur aura un travail d'​autant plus important à fournir.\\
 Exemple pour un ordinateur un peu ancien (2 coeurs, 4GB de RAM). Un Wiktionnaire de 3,6GB a demandé environ 4 heures et 2GB de mémoire, en prenant 50% du CPU (index créé **/​home/​moi/​.goldendict/​index/​xxxxxx_FTS** de 729MB). Cela reste supportable a priori. Mais pour un autre fichier zim de 6GB (contenant toujours du texte principalement),​ il commence, mais finit par pratiquement stopper (semble swapper à l'​infini). L'​indexation "​full-text search"​ ne semble pas possible.\\ Exemple pour un ordinateur un peu ancien (2 coeurs, 4GB de RAM). Un Wiktionnaire de 3,6GB a demandé environ 4 heures et 2GB de mémoire, en prenant 50% du CPU (index créé **/​home/​moi/​.goldendict/​index/​xxxxxx_FTS** de 729MB). Cela reste supportable a priori. Mais pour un autre fichier zim de 6GB (contenant toujours du texte principalement),​ il commence, mais finit par pratiquement stopper (semble swapper à l'​infini). L'​indexation "​full-text search"​ ne semble pas possible.\\
  
 __Solutions partielles.__\\ __Solutions partielles.__\\
 Le problème sera peut-être résolu dans une prochaine version, en attendant, si vous le rencontrez vous pouvez le résoudre plus ou moins, de différentes manières:​\\ Le problème sera peut-être résolu dans une prochaine version, en attendant, si vous le rencontrez vous pouvez le résoudre plus ou moins, de différentes manières:​\\
-  * Indiquer par exemple la valeur 5 000 000 à cet endroit:\\ //Édition > Préférences > Recherche en texte intégral > Ne pas rechercher dans les dictionnaires contenant plus de [5000000] article(s).//​ \\ Ce chiffre a été choisi en notant le nombre de mots des 2 .zim incriminés dans l'​exemple donné (c'est sans doute le nombre ​de motsmême si le nombre d'​articles indiqué est à peu près le même alors qu'il devrait être très inférieur, ​il semble juste y avoir un petit bug pour le comptage), nombre visible ici:\\ //Édition > Dictionnaires > Dictionnaires// ​Cliquer sur le fichier voulu, et les détails s'​affichent.\\ Puis en prenant simplement une valeur un peu supérieure à celle indiquée pour le fichier qui réussissait en 4 heures, et inférieure au second. "5 000 000" est à adapter donc selon votre cas. Ceci a permis la création de l'​index pour le 1er fichier (et d'​autres ​éventuels ​plus petits ou un peu plus grands en nombre de mots, du moins c'est le but), et a exclu le second (et les plus grands). Pour les fichiers exclus, l'​index de "texte intégral"​ ne sera pas créé, et la recherche malheureusement ne s'​effectuera que sur les titres ​des articles+  * Indiquer par exemple la valeur 5 000 000 à cet endroit:\\ //**Édition > Préférences > Recherche en texte intégral > Ne pas rechercher dans les dictionnaires contenant plus de [5000000] article(s).**// \\ Ce chiffre a été choisi en notant le nombre de mots des 2 .zim de l'​exemple donné (c'est sans doute le nombre ​à noter, le nombre d'​articles indiqué est à peu près le même alors qu'il devrait être très inférieur, ​est-ce ​un bug?), nombre visible ici:\\ //**Édition > Dictionnaires > Dictionnaires ​>**// Cliquer sur le fichier voulu, et les détails s'​affichent.\\ Puis en prenant simplement une valeur un peu supérieure à celle indiquée pour le fichier qui réussissait en 4 heures, et inférieure au second. "5 000 000" est à adapter donc selon votre cas. Ceci a permis la création de l'​index pour le 1er fichier (et d'​autres plus petits ou un peu plus grands en nombre de mots, du moins c'est le but), et a exclu le second (et les plus grands). Pour les fichiers exclus, l'​index de "texte intégral"​ ne sera pas créé, et la recherche malheureusement ne s'​effectuera que sur les titres. 
-  * Vous pouvez aussi augmenter vos chances de réussite en libérant de la mémoire pendant l'​indexation (fermer les autres logiciels et processus), ou en ajoutant de la RAM.+  * Vous pouvez aussi augmenter vos chances de réussite en libérant de la mémoire pendant l'​indexation (fermer les autres logiciels et processus), ou en ajoutant de la RAM. Si vous indexez plusieurs gros fichiers, fermez et rouvrez GoldenDict entre chaque car cela libère de la mémoire.
   * Ou décocher la recherche en texte intégral, ou décocher les fichiers zim.   * Ou décocher la recherche en texte intégral, ou décocher les fichiers zim.
-  * Ou préférer un autre gestionnaire,​ ou utiliser ​à la fois GoldenDict ​et un autre.+  * Ou utiliser ​[[Kiwix]] pour les .zim pour lesquels ​GoldenDict ​ne cherche pas en "texte intégral"​.
 </​note>​ </​note>​
 ====Wikipédia==== ====Wikipédia====
  • goldendict.1673543623.txt.gz
  • Dernière modification: Le 12/01/2023, 18:13
  • par 94.238.12.29