Diese Seite mit anderen teilen ...

Informationen zum Thema:
Forum:
Geschichte und Gegenwart der Zeugen Jehovas
Beiträge im Thema:
11
Erster Beitrag:
vor 8 Jahren, 5 Monaten
Letzter Beitrag:
vor 8 Jahren, 5 Monaten
Beteiligte Autoren:
prozessor, Drahbeck, Gerd

Re: VISIONS OF ANGELS

Startbeitrag von prozessor am 25.08.2009 16:38

Zitat
Drahbeck
Faksimiles als solche lassen sich schwerlich mit Suchprogrammen ermitteln.


Ich habe auf meinem Rechner Google Desktop Search zusammen mit dem kostenlosen OCR-Plugin von ScanSoft installiert. Dadurch wird der Text aller Bilddateien per OCR erfasst, und ich kann bequem nach Bildern suchen, in denen ein bestimmter Text vorkommt.

Bei Bedarf kann ich gerne eine detailliertere Anleitung schreiben.

Antworten:

Re: Bildernamen

Zitat
prozessor
Dadurch wird der Text aller Bilddateien per OCR erfasst, und ich kann bequem nach Bildern suchen, in denen ein bestimmter Text vorkommt.


Das hilft aber nur wenn der Name in etwa schon den Inhalt erahnen lässt.
Bei dem "Allerweltsnamen" "File" (als Beispiel) - in ungezählten Mengen vorhanden, dürfte wohl auch da die Grenze des Machbaren erreicht sein.

von Drahbeck - am 25.08.2009 17:20

Re: Bildernamen

Zitat
Drahbeck
Das hilft aber nur wenn der Name in etwa schon den Inhalt erahnen lässt.
Bei dem "Allerweltsnamen" "File" (als Beispiel) - in ungezählten Mengen vorhanden, dürfte wohl auch da die Grenze des Machbaren erreicht sein.


Nein, eben nicht. Der Inhalt des Bildes wird erfasst.

Ich suche beispielsweise nach "Harmagedon" und erfahre, dass dieser Text in den Bildern file0001-48.jpg, file0002-12.jpg und pe254.jpg vorkommt.

von prozessor - am 25.08.2009 17:34

Re: Bildernamen



von prozessor - am 25.08.2009 17:40

Re: OCR-Plugin

Zitat
prozessor
Ich habe auf meinem Rechner Google Desktop Search zusammen mit dem kostenlosen OCR-Plugin von ScanSoft installiert. Dadurch wird der Text aller Bilddateien per OCR erfasst, und ich kann bequem nach Bildern suchen, in denen ein bestimmter Text vorkommt.

Bei Bedarf kann ich gerne eine detailliertere Anleitung schreiben.


Ich hatte mal, ist allerdings schon länger her (danach auch nicht mehr aktualisiert worden), mal als Scan-Programm das von Scan Soft
ScanSoft OmiPage Pro 12.0

Mit selbigen war ich nicht sonderlich zufrieden, dieweil beim gewöhnlichen Texteinscannen, das Programm gewisse Teile als "Bilder" ansah, die aber keine tatsächlichen Bilder sind (und somit nicht als Text einscannte, was sich dann in der Praxis als relevante Lücken herausstellt).

Im Zuge einer anderen Scanner-Zulegung bin ich dann bei dem Programm von Abby (mit beim Scanner beigelegt) gelandet, und bin mit dem auch relativ zufrieden.
Man darf nur nicht den Fehler machen, die penetrant angebotenen Aktualisierungen, oder Umsteigen auf das vorgebliche professionellere Programm von Abby, auch anzunehmen.
Dann nämlich wird es teuer - richtig teuer.
Dann ist nämlich der Kaufpreis des ursprünglichen Scanners dabei nur noch ein "Klacks".

Aber diese Politik kennt man ja bereits von den Tintenstrahldruckern. Der eigentliche Drucker ist preiswert. "Kasse" wird dann mit den Druckerpatronen gemacht.

Google Desktop Search. Die Krake Google hat dieses Programm gleichzeitig so ausgestaltet, dass nicht nur der örtliche Rechner durchsucht wird, sondern zugleich alle dort ermittelten Daten, auch auf den Zentralrechnern von Google landen.
Daher habe ich die Finger davon gelassen. In PC-Zeitschriften wurde (gelegentlich) auch schon davor gewarnt.

Ich verwende das Programm A-Z Finder (schon früher hier mal bemerkt) und bin mit seiner Leistung sehr zufrieden (mit der Einschränkung es handelt sich noch um einen Rechner mit Windows XP.
Unter Vista läuft es zwar auch (mehr schlecht als recht). Hat man ein gut ausgestattetes Nervenkostüm (kann man auch unter Vista mit ihm zurecht kommen).
Insofern benötige ich Google Desktop nicht und habe auch nicht die Absicht es zu verwenden.
Das wäre also meine Ausgangsbasis.

Ob unter diesen Konstellationen, das von Dir genannte OCR-Plugin "Sinn" machen würde, weis ich nicht. Auf gewagte Experimente möchte ich mich dabei auch nicht einlassen.
Aber wenn es Dir nichts ausmachen würde, würde mich die angebotene Beschreibung diesbezüglich schon mal interessieren.
Eine Gewähr ihrer tatsächlichen Verwendung kann ich allerdings nicht übernehmen.

von Drahbeck - am 26.08.2009 05:53

Re: OCR-Plugin

Aaaalso ...

das ScanSoft-Plugin ist - zumindest in der kostenlosen Version - ausschließlich für Google Desktop Search (GDS) geeignet.

Allerdings ist es natürlich nicht so, dass GDS "alle auf dem Rechner ermittelten Daten" zu Google überträgt. Es bietet allerdings eine optionale Funktion, die die Suche über mehrere (eigene) Computer ermöglicht - nur, wenn man die einschaltet, wird der Suchindex zu Google übertragen (anders kann das auch nicht funktionieren).

Im Normalbetrieb wird "nur" eine eindeutige Computer-ID übertragen. Sofern man sich mit einem Google-Konto angemeldet hat und z. B. Google Mail nutzt, könnte Google darüber den Computer identifizieren. Mehr aber nicht.

Übrigens funktioniert die OCR von ScanSoft nicht mit Frakturschrift. Dafür gibt es, soweit mir bekannt, kein Programm außer dem recht kostenintensiven Abby FineReader.

von prozessor - am 26.08.2009 15:04

Re: OCR-Plugin

Ja, dann danke ich für die Info.
Aus meiner Sicht (und Interessenlage) würde ich das so zusammenfassen. Der reale Nutzen hält sich eher in engen Grenzen.
Würde auch Frakturschrift erkannt - das wäre dann zu schön um wahr zu sein.
Nur die Erkennung der heute üblichen Schreibschrift. Da wäre allenfalls der Zeitraum vor 1970 interessant.
Aber auch für diesen Zeitraum gibt es "Eselsbrücken." Gelegentlich werden bei Abfragen der WTG CD-ROM auch Verweise auf Belegstellen vor 1970 geliefert.
Dann kann ich die auch in der entsprechenden WTG-Literatur dann selbst nachschlagen.
Und mittels der Englischsprachigen CD-ROM gelangt man den WT betreffend, gar bis ins Jahr 1950 zurück. Dann ist allenfalls die Mühe, zu suchen, in welcher deutschen Ausgabe (die ja differieren), das Gesuchte gefunden werden kann.

von Drahbeck - am 26.08.2009 15:37

Re: OCR-Plugin

Es wäre ja super wenn man bestimmte Inhalte aus diesem Archiv...

http://www.manfred-gebhard.de/Forumsarchiv.htm

... finden könnte.

.+ hat in etlichen Fällen auch nach dem Faksimile in Normalschrift noch einige Wörter ausgeschrieben.



von Gerd - am 26.08.2009 15:38

Re: OCR-Plugin

Zitat
Gerd
Es wäre ja super wenn man bestimmte Inhalte aus diesem Archiv...

http://www.manfred-gebhard.de/Forumsarchiv.htm

... finden könnte.

.+ hat in etlichen Fällen auch nach dem Faksimile in Normalschrift noch einige Wörter ausgeschrieben.


Ja lieber Gerd,
Da kann ich nur meine bereits früher geäußerte Empfehlung wiederholen.
Auf dem eigenen Rechner einen Ordner anlegen.
Die reichlich 300 Forumsarchive herunterladen. Es reicht wenn nur das Textgerippe (ohne die Bilder) heruntergeladen wird. Selbige in diesen Ordner platzieren.
Dann die Windows-Suchfunktion für diesen Ordner nutzen.
Da wird jedes vorhandene Wort (außer Umlaute) ermittelt.
Wer es komfortabler haben will, legt sich für diesen Suchvorgang, wie @ Prozessor, das kostenlose Programm "Google Desktop Search" zu.
Oder auch das gleichfalls für Privatnutzer kostenlose Programm "A-Z Finder".

von Drahbeck - am 26.08.2009 15:56

Re: OCR-Plugin

Zum Herunterladen ganzer Websites inkl. Bildern kann man auch das kostenlose Tool WinHTTracker benutzen.

Und den Ordner dann z. B. mit Google Desktop Search + ScanSoft Plugin indizieren.

von prozessor - am 26.08.2009 18:23

Re: OCR-Plugin

Genau. Wer nicht blos oberflächlich im Internet lesen will, sondern bestimmte Stellen wiederfinden will, von denen nur noch die blasse Ahnung vorhanden ist, auf welcher Webseite sie denn vorhanden sein könnte, der kommt um "WinHTTrack Website Copier" einfach nicht herum.

Kürzlich hatte die Zeitschrift "Ct-Magazin" schon zum zweiten mal auch dieses Programm (in der Deutschsprachigen Variante) als Software-Angebot (kostenlos) auf ihrer regelmäßigen Software-DVD-Beilage, mit drauf.
Ob man so im Internet auch die Deutschsprachige Variante finden kann, weis ich auf Anhieb nicht. Die Englischsprachige Variante ist jedenfalls greifbar.
Hier früher auch schon mal erwähnt.

http://www.httrack.com/

http://www.heise.de/software/download/httrack_website_copier/2320

Zum A-Z Finder siehe auch

http://www.a-z-technology.de/
Diese Seite ist etwas verwirrend gestaltet. Man muss sich in der Rubrik Download konzentrieren auf
A-Z Finder 1.08

Wer sich zum Download des A-Z Finder entschliessen sollte, nochmals die Empfehlung, die Voreinstellung nutzen, die Daten im Ordner "Eigene Dateien" durchsuchen zu lassen.
Das heisst "übersetzt", die (vorhandenen Dateien) in diesem Ordner zu platzieren.
Es besteht auch die Option die gesamte Webseite durchsuchen zu lassen.
Davon würde ich abraten, dieweil man dann auch etlichen "Schrott" mitgeliefert bekommt, beispielsweise Wörter die in Windows oder anderen Programmen mit vorkommen.

von Drahbeck - am 27.08.2009 04:26
Zur Information:
MySnip.de hat keinen Einfluss auf die Inhalte der Beiträge. Bitte kontaktieren Sie den Administrator des Forums bei Problemen oder Löschforderungen über die Kontaktseite.
Falls die Kontaktaufnahme mit dem Administrator des Forums fehlschlägt, kontaktieren Sie uns bitte über die in unserem Impressum angegebenen Daten.