From Sarge to Etch - utf8check
I'm going from iso-8859-1 to utf-8.
Beim Update auf Debian/Etch habe ich so meine Problemchen mit den Zeichensätzen. Jahrelang habe ich nur iso-8859-1/15 für alle möglichen Dateien verwendet. Da Debian/Etch per Default mit UTF8-Einstellungen kommt, sehen meine alten Dateien teilweise sehr seltsam aus. Jetzt habe ich mich entschieden, konsequent UTF8 zu verwenden.
Что делать?
Ja, gute Frage. :-)
Natürlich gibt es iconv
und convmv
,
aber die Anwendung auf der Console gefällt mir überhaupt nicht, teilweise scheint es auch Probleme
bei der Konvertierung zu geben. Das Umbenennen von Dateinamen funktioniert gut, aber gerade das brauche
ich nicht unbedingt. Probleme gibt es, wenn Dateiinhalte konvertiert werden sollen und man macht dieses
zufällig oder dummerweise mehrmals. Die Frage war nur: "Wie macht man die ganze Sache irgendwie effektiver?".
Zuerst dachte ich, schreibst du ein paar Skripte die alles automatisch erledigen. Das wäre eine feine
Sache, aber der Teufel steckt wie immer im Detail.
Meine neueste Idee ist, dass man das Menü des Midnight Commanders
um
einige Punkte erweitert. Das hat ein paar mächtige Vorteile z.B.: gezielte Auswahl der Dateien, die
konvertiert werden sollen oder rekursive Umbennung ganzer Verzeichnisbäume und Dateien.
Zum Einsatz kommen dabei ebenfalls iconv
und
convmv
. Das Skript utf8check
macht
nicht allzu viel. Es versucht nur zu erkennen, ob es sich um UTF8-Dateien handelt oder nicht - das
soll eine mehrfache Konvertierung verhindern.
Menü des Midnight Commanders - erreichbar über F2
Die Umsetzung
Nach der Installation von utf8check
wird die Datei
/etc/mc/mc.menu
durch eine angepasste Version ausgetauscht.
Ein Backup der alten Datei ist empfehlenswert. Man kann die Menü-Datei aber auch nur im
Home-Verzeichnis des Users austauschen. In den angepassten Versionen kann der Zeichensatz
dem jeweiligem System angeglichen werden. (Tipp: auch bei Verwendung von iso-8859-1 kann
man den Zeichensatz auf iso-8859-15 belassen.)
Hinweise zur Benutzung
Überlegen Sie sich genau, was Sie konvertieren wollen!
Zur Konvertierung sollten nur Textdateien verwendet werden, ich denke bei Binärdateien kommt das nicht so gut. :-)
Wenn Sie der ganzen Geschichte nicht vertrauen - arbeiten Sie nicht als root!
Testen Sie als User die Konvertierungen erstmal in einem Testverzeichnis, bevor Sie
an Ihre wertvollen Dateien rangehen. Ein Backup kann nie schaden...
Das Programm ist - hier direkt - oder über mein Debian Repository erreichbar.
Hier ist der Eintrag für /etc/apt/sources.list:
### utf8check for Debian GNU/Linux
deb http://www.linuxer.onlinehome.de/debian/ ./
Anregungen, Wünsche und Fehlermeldungen bitte im Userforum melden.
See you later. :-)