Documentation avancée

En cours de rédaction…

Vérifier ratures livres !!

Bénévoles !

Sommes à la recherche de spécialistes xpath, xslt, xml, sed…

Dublin Core

http://wiki.dublincore.org/index.php/FAQ/DC_and_DCTERMS_Namespaces

http://wiki.dublincore.org/index.php/User_Guide

http://wiki.dublincore.org/index.php/User_Guide/Creating_Metadata#Identifiers

http://dublincore.org/documents/dcmi-terms/

http://guides.bib.umontreal.ca/disciplines/20-Citer-selon-les-normes-de-l-APA?tab=108

http://p2p.wrox.com/xslt/79311-how-process-multiple-input-xml-files-single-xslt.html

http://exslt.org/exsl/elements/document/index.html

http://exslt.org/exsl/index.html

http://miage.univ-nantes.fr/miage/D2X1/chapitre_xslt/section_multidoc.htm

http://docstore.mik.ua/orelly/xml/xslt/ch07_03.htm

LibreOffice calc pas compatible avec <table:table-header-rows>, mais LO writer, oui.

Espace de nom XML pour les MARC relations :

xmlns:marcrel="http://id.loc.gov/vocabulary/relators/"

définition des codes :

http://id.loc.gov/vocabulary/relators.rdf

<marcrel:trl/> pour translator

https://msdn.microsoft.com/fr-fr/library/ms171485.aspx

Caractères spéciaux en xml

< &lt;
> &gt;
& &amp;
" &quot;
' &apos;

FTP

Writer2latex

Conversion htm → xhtml

sed 's,&nbsp;, ,g' xxx.htm > xxx.html

html2xhtml

Installation à partir de Git (pour Linux par exemple)

sudo apt install byacc flex
git clone https://github.com/jfisteus/html2xhtml.git
cd html2xhtml
# less README # if you want to control…
aclocal
libtoolize
touch config.rpath
autoheader
automake --add-missing
autoconf
./configure
sudo make install #installation pour tous les utilisateurs
html2xhtml xxx.htm -o xxx.xhtml # conversion en xhtml

à partir des sources dans l’archive (pour cygwin)

wget http://www.it.uc3m.es/jaf/html2xhtml/downloads/html2xhtml-1.3.tar.gz

./configure

make

Une fois qu’on a du XHTML, on peut réaliser un pré-traitement avec xsltproc… avant la conversion en fodt.

Attention ! Html2xhtml altère le contenu de l’html (certains liens !??)… voir si ça a vraiment de l’importance…

xpath

http://svground.fr/xpath-axes.php

http://xmlfr.org/w3c/TR/xpath

xslt

http://xmlfr.org/w3c/TR/xslt

LibreOffice

Chercher avec les expressions régulières : ctrl+h (Chercher & remplacer), alt+o (Autres options), alt+x (expressions régulières), alt+c+c, <espace> (Respecter la casse), alt+r (rechercher).

  • les sauts de au milieu d’une phrase : ^[a-z][a-z,]<Entrée>. Cela signifie :

    • ^ : en début de ligne,
    • [a-z] : un caractère de « a » à « z », en minuscule,
    • [a-z,] : un caractère de « a » à « z », en minuscule ou une espace.
    • <Entrée> : cherche les début de ligne commençant par une minuscule, sauf les débuts de lignes du type a), b), c)… Si vous en trouvez, corrigez les sauts de ligne erronés.
  • Les citations : ^« . cela signifie :

    • ^ : en début de ligne,
    • « : le caractère "« " suivi d’une espace insécable.

Chercher les styles : ctrl+h (chercher/remplacer), alt+o (Autres options), alt+b (attributs) ; sélectionner « inclinaison », « Ok ». alt+c <Entrée> (Tout chercher). Dans le styliste : Style de caractère, accentuation. À nouveau : ctrl+h (Chercher & remplacer), alt+o (Autres options), mais cette fois alt+f (Aucun format), <Entrée>, puis alt-m (Format), <Entrée> (une fenêtre s’ouvre), alt+s

vim et sed

Attention ! Contrôle avant d’exécuter !

:%s,<text:bookmark text:name="footnote[0-9]*"/><text:a xlink:type="simple" xlink:href=".\{-}#bookmark[0-9]*" text:style-name="Internet_20_link" text:visited-style-name="Visited_20_Internet_20_Link"><text:span text:style-name="Emphasis">[0-9]*</text:span></text:a>,<text:note text:id="ftn1" text:note-class="footnote"><text:note-citation>1</text:note-citation><text:note-body> <text:p text:style-name="Footnote"/></text:note-body></text:note>,cg
find – name "*fodt" --print0 |xargs -0 sed 's,<text:a xlink:type="simple" xlink:href=".*#bookmark[0-9]*" text:style-name="Internet_20_link" text:visited-style-name="Visited_20_Internet_20_Link">[0-9]</text:a>,<text:note text:id="ftn1" text:note-class="footnote"><text:note-citation>1</text:note-citation><text:note-body>\n <text:p text: style-name="Footnote"/></text:note-body></text:note>,g'

git

.gitconfig :

[user] 
    email = your@email
    name = yourname
[alias] 
    co = checkout
    ci = commit
    st = status
    br = branch
    hist = log --pretty=format:\"%ad %C(yellow)%h%Creset | %C(red)[%an]%Creset %s%d\" --date=short
    type = cat-file -t
    dump = cat-file -p
[color]
	ui = true
[core]
	editor = vim -c 'startinsert!'

Ajouter un commit :

git ci -a

Suivre les modifications d’un fichier :

git log --follow filename

revenir à une ancienne version de fichier :

Assuming the commit you want is abcde:

git checkout abcde file/to/restore

Corriger les italiques du Vocabulaire de la Psychanalyse

Faire un fichier avec les bons italiques à partir du fichier OCR, faire un diff avec la version actuelle, modifier le diff pour ne retenir que les italiques, appliquer le diff. (??)

Saut de ligne au milieu d’un paragraphe

Si le paragraphe est coupé entre deux phrases, il faut utiliser vim : le style de paragraphe est nommé :

P[0-9]*

quelque chose.

Titres

Chercher le gras pour trouver les titres. S’il y a peu de titres, donner un style directement. Sinon, noter le formatage manuel de chaque niveau de titre. Chercher par formatage et convertir en niveau de titre correspondant.

Cherchez saut de ligne, qui correspondent à des sections sans titre. Leur donner un titre [1], [2], [2.1]…

Italiques, gras, petites majuscules

Chercher italique et convertir en accentuation.

Chercher les gras et vérifier s’ils ont une signification.

Chercher italique gras et convertir en accentuation.

Chercher petites majuscule et convertir en style petites majuscules ?

Regex (expressions rationnelles)

http://olivier.berquin.free.fr/indesign/grep_indesign.html

Contrôler absence de point avant majuscule.

Contrôle signification mot maj.

Grammelecte

\{-}

matches 0 or more of the preceding atom, as few as possible, nongreedy match

http://vimregex.com/

.*?

matches 0 or more of the preceding atom, as few as possible.

Attention : vérifier ce code avant de l’utiliser ! NON ! Sed ne supporte pas le non-greedy quantifier !

utiliser perl ?

apt perl-doc
perl -pi -w -e 's,<text:a xlink:type="simple" xlink:href=".*?#,<text:a xlink:type="simple" xlink:href="#,g' ./melman/2002/homme_gravite.fodt

Espace insécable anormaux (espace+espace insécable)

(N.D.T) en italique ?

Sub ndt in (N.D.T)

contrôle sauts de section sans titre.

Caractères spéciaux, images… titres…

image :

convert xxx.pdf[page -1] image.png

contrôler les introductions qui sont en italique, et les sauts de section !

grammelecte

Les « V » pour « l' »

« chap. m ou n » pour « chap. III ou II »

. 11

U -> li il l', etc.

*

A maj avec accent

A (A

[a-z] Y[a-z]

[a-z] V[a-z]
^« qui sont des citations.

faire la table des matières, la vérifier.

États-Unis

^[A-Z]\. (citation)

^[0-9]*\. (liste)

• (guillemet ou autre)

[a-Z] [a-Z] (supprimer les espaces insécables mal placées)

Ligne de commande LibreOffice

Copier le répertoire utilisateur sous un autre nom :

cp C:\Users\x\AppData\Roaming\LibreOffice\4 C:\Users\x\AppData\Roaming\LibreOffice\4-bis

Par exemple. Cela permet de ne pas être obligé de fermer LibreOffice pour pouvoir lancer une nouvelle instance en ligne de commande.

Ainsi les lignes de commande commencent par :

soffice -env: UserInstallation=file:///c:/Users/x/AppData/Roaming/LibreOffice/4-bis

ou équivalent.

Exemple de conversion :

soffice -env: UserInstallation=file:///c:/Users/x/AppData/Roaming/LibreOffice/4-bis --convert-to fodt *.odt

à combiner avec find.

Fichiers qui ne s’ouvrent pas

Si ton fichier ne s’ouvre pas, c’est sans doute parce que tu as un fichier caché qui bloque son ouverture.

Vas dans ton dossier de travail, celui où il y a le fichier, et suis les instructions suivantes:

http://www.clubic.com/windows-os/windows-7/aide-astuce-tuto/windows-7-comment-faire-apparaitre-mes-dossiers-caches-2518.html

Tu devrais voir apparaître un fichier nommé .~lock.NOM-FICHIER.fodt#

Supprimes-le et tu pourras alors ouvrir NOM-FICHIER.fodt

tu peux recacher les fichiers cachés en suivant les instructions inverses du lien précédent.