Archiv der Kategorie: Linux

Alles rund um die Pinguine – auf dem Desktop und dem Server

OCR unter Linux revisited

gimagereader_tesseract

Tesseract befindet sich in einer aktuellen Version in den Repos von Fedora 18 (sowie Ubuntu) und gimagereader ist als RPM für Fedora 15 / als DEB für Ubuntu nach Installation einiger Voraussetzungen nicht nur installierbar, sondern arbeitet rund.

Die Voraussetzungen werden mit RPM bei einem

rpm -i gimagereader-0.9-1.fc15.noarch.rpm

angezeigt und sind zügig an Bord geholt:

yum install gnome-python2-gtkspell pypoppler python-imaging-sane

Wer unter Ubuntu mit gdebi, qapt oder über das Softwarecenter installiert, zieht die Abhängigkeiten automatisch mit.

Die Erkennungsleistung ist schon bei 300 DPI Scans hervorragend und kann durchaus mit kommerziellen Produktion mithalten – selbst bei kursivem Text oder leicht schrägen Vorlagen.

Was man von dieser Lösung nicht erwarten darf, sind Mehrfachtextboxen oder gar ordentliche Erkennungsleistungen bei Tabellen. Was auch nicht geht, ist der Export von Bildern oder des Layouts aus dem Scan in die Textdatei. Tesseract liefert plain text. Wer mehr will, kann z.B. das sehr gute Online-OCR von Finereader benutzen: http://finereader.abbyyonline.com/

GoAccess

accesslogfiles

Logfileanalyse frisst im Normalfall Systemressourcen – nicht viele, aber unnötig viele, wenn man sich nicht wirklich für die Zugriffszahlen interessiert und nur alle paar Wochen einmal guckt. Dazu ein AwStats oder einen Webalizer zu betreiben ist overkill. Der Einsatz von PiWik ist praktisch, aber das Programm hält sich derartig brav an die Do Not Track Einstellungen, dass man nicht erfährt, wie viele Menschen einen wirklich besucht haben. Hier einmal im Vierteljahr vergleichen zu können ist schön.

Praktisch ist ein Tool wie GoAccess, das man nur bei Bedarf einsetzt und das man gezielt auf ausgewählte Logfiles loslassen kann. Das jeweils aktuelle Apache Log holt man sich mit

goaccess -f access.log.1

in den Betrachter. Will man gz archivierte Archive betrachten, muss man diese zuerst auspacken – z.B. mit zcat. Wenn man sich schon die Mühe macht, dann kann gleich ein ganzer Monat zusammen ausgepackt und dann betrachtet werden. Dazu schaut man die Logs in ihrem Verzeichnis zuerst mit ls -lat an, um das Datum etwas einzugrenzen und erzeugt dann ein Gesamtdokument aus der Auswahl:

zcat access.log.[4-7].gz >> accesslogcombined ; goaccess -f accesslogcombined

Wenn man fertig ist, kann man die kombinierte Logdatei wieder löschen.

Neuere Versionen von goaccess – nicht jedoch die für Debian aus den Repos verfügbaren Oldtimer – erlauben auch das Erstellen von HTML Reports. Sehr praktisch. Und viel hübscher als eine nscurses Oberfläche ist es auch.

LMDE und CPU Zahl

Schnarchlangsam ist mein oller Asus  – und das obwohl Debian eigentlich weniger Ressourcen frisst als Ubuntu. Also schaute ich mal mit top nach, was da an den Ressourcen zehrt und stolperte über xorg, der 35% der CPU schluckte. Dazu kam: LMDE erkannt nur eine CPU des Dualcores.

$ dmesg | grep CPU
[    0.000000] ACPI: NR_CPUS/possible_cpus limit of 1 reached.  Processor 1/0x1 ignored.
[    0.000000] Initializing CPU#0
[    0.000000] CPU 0 irqstacks, hard=f5808000 soft=f580a000
[    0.012261] CPU: AMD Turion(tm) 64 X2 Mobile Technology TL-52 stepping 02
[    0.586082] Switch to broadcast mode on CPU0

Das scheint ein Debian Bug zu sein, der sich durch die Installation eines PAE Kernels beheben lässt:

sudo apt-get install linux-headers-3.2.0-3-686-pae linux-image-3.2.0-3-686-pae

Und tatsächlich – danach stimmt wenigstens die Verwendung der CPU Zahl:

$ dmesg | grep CPU
[    0.000000] SMP: Allowing 2 CPUs, 0 hotplug CPUs
[    0.000000] setup_percpu: NR_CPUS:32 nr_cpumask_bits:32 nr_cpu_ids:2 nr_node_ids:1
[    0.000000] PERCPU: Embedded 14 pages/cpu @f79d5000 s33280 r0 d24064 u57344
[    0.000000] Initializing CPU#0
[    0.000000] CPU 0 irqstacks, hard=f5806000 soft=f5808000
[    0.004382] CPU: Physical Processor ID: 0
[    0.004385] CPU: Processor Core ID: 0
[    0.004389] mce: CPU supports 5 MCE banks
[    0.069029] CPU0: AMD Turion(tm) 64 X2 Mobile Technology TL-52 stepping 02
[    0.072003] CPU 1 irqstacks, hard=f5894000 soft=f5896000
[    0.008000] Initializing CPU#1
[    0.156188] Brought up 2 CPUs
[    0.156186] Switch to broadcast mode on CPU1
[    0.156895] Switch to broadcast mode on CPU0

Was sich nicht so einfach in den Griff bekommen lässt, ist der unendlich zähe nouveau Treiber, der xorg mit 35% CPU-Last weiterhin viel zu umfangreich beschäftigt. LMDE geht also weiterhin eher zäh zu Werke. Wenn F18 auf den Markt kommt, dann fliegt LMDE wieder runter … oder ich spiel hier mit Kubuntu weiter.

Thunderbird unter LMDE

Der bei LMDE mitgelieferte Senior Thunderbird 14.0 verträgt meine AddOns nicht. Also musste eine neuere Version an Bord, die ich mir auf Grund eines Hinweises und Skriptes hier direkt von dieser Seite besorgte. Gleich auf ein Skript zu setzen – das war mir zu heftig. Ich spiel das lieber ein paar mal durch und wenn ich dann die Fallstricke kenne wird geskripted. Also erst einmal von Hand:

wget http://mirror.informatik.uni-mannheim.de/pub/mirrors/mozilla.org/thunderbird/releases/latest/linux-i686/de/thunderbird-16.0.2.tar.bz2

cd /opt

mv thunderbird thunderbird$(date“+%Y%m%d.%H%M%S“)

sudo mv /home/dirk/thunderbird-16.0.2.tar.bz2 .

sudo tar xjf thunderbird-16.0.2.tar.bz2

Es folgt ein Teststart von Thunderbird, die Aktualisierung aller AddOns und wenn es tut, dann kommen das alte Thunderbirdverzeichnis und das Archiv in /opt weg. Zum Schluss noch ein Hinweis an die Paketverwaltung:

sudo vi /var/lib/dpkg/status

Hier die Versionsnummer von Thunderbird anpassen, so dass nur aktuellere Versionen als die nun installierte an Bord kommen. Ein dpkg -l | grep thunderbird zeigt den Erfolg.

Auswahl treffen

Ich musste neulich in einem Ordner mit lauter automatischen Moodle-Kursraum-Exporten (*.mbz) nur die in ein Archiv schieben, die Teil des letzten nächtlichen Backups waren. Ältere Dateien sollten draußen bleiben. Hiermit ging das ganz flott:

tar cvzf backup.tar.gz $(find . -daystart -ctime 0 -type f -name „*.mbz“)

Ich hab davor etwas gegooglet gehabt und viele Tipps gefunden, die das Problem mit -exec oder | xargs  angehen und dann ausprobiert (z.B. die hier)  … und bin dabei nicht glücklich geworden.

E-Mail aus LibreOffice unter KDE

In LibreOffice unter /Extras /Optionen ist sensible-lomua als Mailschnittstelle für den Versand direkt aus LO heraus eingetragen. So sensible (oder sinnvoll) benimmt sich die aber nicht, ignoriert sie doch die Einstellungen der Standardkomponente, die man in den KDE-Systemeinstellungen vornehmen kann. Zumindest für Kubuntu 12.04 …

Der Eintrag /usr/bin/thunderbird in den LibreOffice Optionen funktioniert aber reibungslos: Was im Thunderbird als Standard-Mailkonto angelegt wurde, wird dann als Versandadresse gewählt und das Dokument wird als ODT in den Anhang geworfen.

Unity vor die Wand

Bei Ubuntu mit ihrem Unity Gewürge gehen mir bei 12.10 langsam aber sicher die Lichter aus: LibreOffice zeigt unter Unity seine Menüs entweder nur noch teilweise … oder überhaupt nicht mehr an. Meistens überhaupt nicht mehr.

Unter KDE jedoch funktioniert alles wie gewünscht und erwartet – hier sind die Menüs und alle Einträge vorhanden. Immer – und nicht nur, wenn es den Herren von Canonical gerade mal einfällt sich etwas weniger restriktiv zu verhalten, als die Macher von Gnome3 – denn unter Gnome3 wäre das sicherlich Programm nach dem Motto keep it simple, der Benutzer braucht die komplexen Menüs von LO ja eh nicht.

Linux lässt einem zwar oberflächlich betrachtet die Wahl beim Desktop – aber nur, wenn man damit nicht arbeiten will. Für alle, die ihre Brötchen mit dem Rechner verdienen heißt es: XFCE oder KDE. In ein paar Jahren evtl. noch Cinnamon.

Kubuntu 12.10 Beta

Da mein D830 noch immer nicht richtig herunter fährt hab ich ihm heute die Kubuntu Beta installiert. Das Image ist riesig – mehr als 900MB dick – und liefert mit den voreingestellten Kerneloptionen kein brauchbares System. Wer nach dem Start von CD auch nur einen grauen Bildschirm sieht, sollte beim Start F6 drücken und quiet aus den Bootoptionen löschen. Dazu noch sollte splash durch nosplash ersetzt werden. Erstens erfährt man so, was das System überhaupt macht und bekommt auch hilfreiche Fehlermeldungen zu sehen und zweitens fährt es mit diesen Einstellungen wie gewünscht in den grafischen Modus hoch.

Wie bei Kubuntu (leider) üblich, sind weder Firefox noch Thunderbird von Haus aus mit an Bord. Diese darf man sich nachinstallieren – wie so vieles anderes auch. Was genau, werfe ich in den nächsten Stunden und Tagen ins KvFG Wiki:

https://www.kvfg.net/wiki/doku.php?id=linux:installation:12_10

Sabayon

Mein oller Asus muss gerade ein Sabayon X verdauen. Hier einige Notizen zum Thema:

Der grafische Installer will beeindrucken, führte auf meinem Laptop aber nur zu einem blankscreen. Nach Drücken von F5 kann man dem Kernel die vielen grafischen Startoptionen (vga, modeset blabla) wegnehmen, dann startet Sabayon zwar weniger schön – aber dafür reibungslos.

Man findet im System dann nicht einmal einen vi – dafür viel anderen Chichi. Ein

equo install vim

zieht einen brauchbaren Editor an Bord.

Die BCM4318 wird zwar erkannt – es fehlen jedoch die Firmware und die Einrichtung. Die folgenden Schritte setzen WLAN in Gang:

equo install b43-firmware b43-fwcutter broadcom-sta linux-firmware

Jetzt wird die blacklist.conf bearbeitet:

vi /etc/modprobe.d/blacklist.conf

und zwar so:

# make broadcom-sta happy
blacklist ssb
blacklist bcma
blacklist brcmsmac
#blacklist b43

Damit b43 beim Hochfahren geladen werden kann, muss er hier aufgenommen werden:

vi /etc/conf.d/modules

mit der folgenden Zeile:

modules=“b43″

Nach einem Reboot funktioniert dann WLAN.

Die blöden Broadcom-Chips scheinen sich stellenweise heftig zu unterscheiden. Auf den Weg oben bin ich gekommen, indem ich mit lsmod mal nachsah, was eigentlich geladen war. Mit rmmod ssb und einem anschließendem modprobe b43 brachte ich WLAN sofort hoch. Die Zeilen oben verstetigen lediglich diesen Fund – zusammengetragen aus X verschiedenen Forenbeiträgen.

Sabayon bringt wenig Software von Mozilla mit. Die kommt wie folgt an Bord:

equo install firefox thunderbird

Insgesamt für einen Ubuntu/Debian-Anwender ein etwas gewöhnungsbedürftiges Konzept – Gentoo eben. Dafür sind viele Dinge da, die man unter DEB und Freunden vermisst. Darunter eine echte /etc/inittab. Ich spiel mal weiter … und werf die restliche Dokumentation ins KvFG Wiki:

https://www.kvfg.net/wiki/doku.php?id=linux:installation:sabayon