A
Anonymous
Gast
Hallo liebe Leute,
ich habe mir mal wieder ein kompliziertes Unterfangen aufgebürdet ...
Ich habe mehrere Internetdokumente (HTML), die ich nach LaTeX umformatieren möchte -- die meisten Sachen sind ja nicht so schwierig (ist ja ähnliche "Sprache"), jedoch beiße ich mir an einer Sache die Zähne aus.
Ich möchte die im HTML-Dokument exisiterenden Endnoten in Fußnoten umformatieren.
Eine Beispiel-HTML-Datei sieht ungefäht so aus:
Und so soll es etwa aussehen:
Man müsste also die Endnote nach oben an die richtige Stelle kopieren.
So Pseudocode-mäßig:
gehe durch den Text; wenn du "( + beliebige Zahlen" findest, dann merke dir die Zahl, suche weiter; wenn du diese Zeichenkette wiederfindest, dann schneide den Text aus, der innerhalb desselben Absatzes (<p>) ist und füge ihn wieder oben ein.
Ich habe mich schon durch alle möglichen sed, awk und sonstigen Sachen gequält, komme aber einfach nicht weiter.
Mit speziellen Script-/Programmiersprachen habe ich nicht so wirklich Erfahrung, aber wenn es nicht allzu viel Aufwand ist, würde ich mich sogar ein bisschen Perl o.ä. lernen.
Weiß einer von euch Rat?
[edit]ich hatte auch schon vor, es händisch zu machen -- aber es sind tausende ...[/edit]
MfG. Mercedesdriver
ich habe mir mal wieder ein kompliziertes Unterfangen aufgebürdet ...
Ich habe mehrere Internetdokumente (HTML), die ich nach LaTeX umformatieren möchte -- die meisten Sachen sind ja nicht so schwierig (ist ja ähnliche "Sprache"), jedoch beiße ich mir an einer Sache die Zähne aus.
Ich möchte die im HTML-Dokument exisiterenden Endnoten in Fußnoten umformatieren.
Eine Beispiel-HTML-Datei sieht ungefäht so aus:
Code:
[...]
<p>bla blub bla bla (1), bli bla blub</p>
[...]
<p><b>Anmerkungen</b>: </p>
<p>(1) Vgl. bla bla bla, seite eins. </p>
[...]
Code:
bla blub bla bla \footnote{Vgl. bla bla bla, seite eins.}, bli bla blub
Man müsste also die Endnote nach oben an die richtige Stelle kopieren.
So Pseudocode-mäßig:
gehe durch den Text; wenn du "( + beliebige Zahlen" findest, dann merke dir die Zahl, suche weiter; wenn du diese Zeichenkette wiederfindest, dann schneide den Text aus, der innerhalb desselben Absatzes (<p>) ist und füge ihn wieder oben ein.
Ich habe mich schon durch alle möglichen sed, awk und sonstigen Sachen gequält, komme aber einfach nicht weiter.
Mit speziellen Script-/Programmiersprachen habe ich nicht so wirklich Erfahrung, aber wenn es nicht allzu viel Aufwand ist, würde ich mich sogar ein bisschen Perl o.ä. lernen.
Weiß einer von euch Rat?
[edit]ich hatte auch schon vor, es händisch zu machen -- aber es sind tausende ...[/edit]
MfG. Mercedesdriver