From Sarge to Etch - utf8check

I'm going from iso-8859-1 to utf-8.

Beim Update auf Debian/Etch habe ich so meine Problemchen mit den Zeichensätzen. Jahrelang habe ich nur iso-8859-1/15 für alle möglichen Dateien verwendet. Da Debian/Etch per Default mit UTF8-Einstellungen kommt, sehen meine alten Dateien teilweise sehr seltsam aus. Jetzt habe ich mich entschieden, konsequent UTF8 zu verwenden.

Что делать?

Ja, gute Frage. :-)
Natürlich gibt es iconv und convmv, aber die Anwendung auf der Console gefällt mir überhaupt nicht, teilweise scheint es auch Probleme bei der Konvertierung zu geben. Das Umbenennen von Dateinamen funktioniert gut, aber gerade das brauche ich nicht unbedingt. Probleme gibt es, wenn Dateiinhalte konvertiert werden sollen und man macht dieses zufällig oder dummerweise mehrmals. Die Frage war nur: "Wie macht man die ganze Sache irgendwie effektiver?". Zuerst dachte ich, schreibst du ein paar Skripte die alles automatisch erledigen. Das wäre eine feine Sache, aber der Teufel steckt wie immer im Detail.

Meine neueste Idee ist, dass man das Menü des Midnight Commanders um einige Punkte erweitert. Das hat ein paar mächtige Vorteile z.B.: gezielte Auswahl der Dateien, die konvertiert werden sollen oder rekursive Umbennung ganzer Verzeichnisbäume und Dateien. Zum Einsatz kommen dabei ebenfalls iconv und convmv. Das Skript utf8check macht nicht allzu viel. Es versucht nur zu erkennen, ob es sich um UTF8-Dateien handelt oder nicht - das soll eine mehrfache Konvertierung verhindern.

Midnight Commander mit Menü-Erweiterung
Menü des Midnight Commanders - erreichbar über F2

Die Umsetzung

Nach der Installation von utf8check wird die Datei /etc/mc/mc.menu durch eine angepasste Version ausgetauscht. Ein Backup der alten Datei ist empfehlenswert. Man kann die Menü-Datei aber auch nur im Home-Verzeichnis des Users austauschen. In den angepassten Versionen kann der Zeichensatz dem jeweiligem System angeglichen werden. (Tipp: auch bei Verwendung von iso-8859-1 kann man den Zeichensatz auf iso-8859-15 belassen.)

Hinweise zur Benutzung

Überlegen Sie sich genau, was Sie konvertieren wollen!
Zur Konvertierung sollten nur Textdateien verwendet werden, ich denke bei Binärdateien kommt das nicht so gut. :-)

Wenn Sie der ganzen Geschichte nicht vertrauen - arbeiten Sie nicht als root!
Testen Sie als User die Konvertierungen erstmal in einem Testverzeichnis, bevor Sie an Ihre wertvollen Dateien rangehen. Ein Backup kann nie schaden...

Das Programm ist - hier direkt - oder über mein Debian Repository erreichbar.
Hier ist der Eintrag für /etc/apt/sources.list:

### utf8check for Debian GNU/Linux
deb http://www.linuxer.onlinehome.de/debian/ ./

Anregungen, Wünsche und Fehlermeldungen bitte im Userforum melden.

See you later. :-)