Script/Programm, dass Textinhalte extrahieren und

- OCinside.de PC Forum
https://www.ocinside.de

-- Software
https://www.forum-inside.de/forums.cgi?forum=17

--- Script/Programm, dass Textinhalte extrahieren und
https://www.forum-inside.de/topic.cgi?forum=17&topic=8540

Ein Ausdruck des Beitrags mit 21 Antworten ergibt bei 3 Antworten pro Seite ca. 7 DIN A4 Seiten. Das entspricht bei 80 g/m² ca. 34.93 Gramm Papier.


-- Veröffentlicht durch The Papst am 23:43 am 5. Juni 2008

Einer? Ich würde sage ~4k, steigend...


;)


-- Veröffentlicht durch Jack the Ripper am 16:55 am 5. Juni 2008

Und fertig :lol:
Und der ganze Stress nur wegen einer SMS :buck:


-- Veröffentlicht durch The Papst am 14:58 am 5. Juni 2008

Problem "gelöst".

In den SMS steht immer die Nummer von der ich die SMS bekommen habe oder die Nummer, an die ich die SMS geschickt habe. Aber nie meine. Also steht praktisch immer der Name da.

Ich versuch mal rauszufinden, wie man die SMS unterscheiden kann. Muss ja irgendwas geben.


Hast ne PM.

(Geändert von The Papst um 15:25 am Juni 5, 2008)


-- Veröffentlicht durch Jack the Ripper am 14:25 am 5. Juni 2008

Ne, brauch nix und will dafür auch garnix nehmen;)

Hier ist dann die Version mit der neuen Text-Formatierung und die source ist auch dabei. Allerdings ist das wohl ziemlich unübersichtlich  und so richtig OOP isses nicht :biglol: ;)

Wenn noch was sein sollte frag ruhig

(Geändert von Jack the Ripper um 14:26 am Juni 5, 2008)


-- Veröffentlicht durch The Papst am 14:18 am 5. Juni 2008

Noch was. Nach ner Zeit ersetzt er die Nummer nicht mehr, durch den Namen. Da steht dann einfach die Nummer:noidea:


-- Veröffentlicht durch The Papst am 14:14 am 5. Juni 2008

Danke, funzt sehr gut.

Nur noch eine kleine Bitte. Könntest du den Namen, der die Nummer ersetzt vor die SMS posten und dann noch ne Eingabe einfügen.

Also so:

Name/Nummer
SMS

Name/Nummer
SMS

...


PS: Kannst du irgendwas gebrauchen? Vielleicht hab ich hier in meinem HW Haufen noch was liegen.

PPS: Könntest du mir die Source auch schicken? Dann kann ich mir mal angucken, wie sowas funzt, und so kleine Details selber "verbessern".


-- Veröffentlicht durch Jack the Ripper am 13:34 am 5. Juni 2008

Okay, also den Zeilenumbruch hab ich gefixt.. der wurd mit dem normalen Editor nicht richtig dargestellt.. mim Wordpad hats komischerweise geklappt.

Der Fehler tauchte wohl auf, weil in einer Nachricht das 3. Zeichen eine schließende Klammer war.
Hab das jetzt auch noch gefixt, allerdings hört die Nachricht dann nach der Klammer auf.
Werd das gleich noch so ändern, dass er die Nachricht nicht bei der klammer beendet, sondern bei dem Zeichen davor.

Das mit der Nummer hatte ich falsch verstanden.. also willste nur die letzte Nummer und die, wenn sie denn einer bestimmten entspricht, durch einen Namen ersetzen.

Ich denke das lässt sich machen.. werd dann Nummer und Name auch noch als Parameter mit einbaun, dann brauchste mir das nicht zu schicken.


E:
Okay es ging schneller als ich dachte ;)
der 3. Parameter ist jetzt die Nummer und der 4. der Name

(Geändert von Jack the Ripper um 13:51 am Juni 5, 2008)


-- Veröffentlicht durch The Papst am 12:32 am 5. Juni 2008

Also das Programm läuft soweit, nur

- funzt es nur mit ~50 Datein gleichzeitig.
- werden alle Nummern aus der Nachricht mit reingeschrieben.
- ist die Datei sehr unübersichtlich.

Es muss nur eine Nummer ersetzt werden, da 99% der Nachrichten von einer Person sind.
Kann man das irgendwie so hinbekommen, das hinter jeder Nachricht ein Absatz gemacht wird? Sonst kann mans kaum lesen.

Und schon mal vielen Dank:godlike::punk::godlike:


Der Fehler kommt, wenn ich zu viel Datein nehme.

(Geändert von The Papst um 12:36 am Juni 5, 2008)


-- Veröffentlicht durch Jack the Ripper am 12:23 am 5. Juni 2008

hm.. das sollte jetzt nichtmehr das riesen Problem sein, aber teste nachher erstmal, ob das soweit mit allen Dateien dieser Art funktioniert.. vllt gehts aus irgendeinem Grund nur mit der, die ich da hab ;)

Is das denn immer nur eine Nummer, die ersetzt werden muss oder ist das ne ganze Liste von Nummern mit dazugehörigen Namen?


-- Veröffentlicht durch The Papst am 12:04 am 5. Juni 2008

Genau so dachte ich mir das, mit ersetzen. Ich werd das Programm gleich mal testen. Wenn ich dir den Namen und die Nummer gebe, kannst du das dann noch einbauen?


-- Veröffentlicht durch Jack the Ripper am 0:39 am 5. Juni 2008

Okay.. hab jetzt ein bischen was gemacht:
Klick

Musst das ganze mit der cmd öffnen und zwar navigierst du zu der jar-Datei und dann gibst du folgendes ein:

java -jar Papst.jar Order_mit_den_Dateien Datei_in_die_die_daten_geschrieben_werden

Also z.B.
java -jar Papst.jar d:\\eingabe\\ d:\\ausgabe\\test.txt

Wichtig ist, dass du doppelte Backslashs machst, damit der kram richtig escapet wird.

Bei der Ausgabe muss der Pfad vorhanden sein, die Datei aber nicht.


Hab nícht ganz verstanden, nach welcher Regel die letzte Nummer durch einen Namen ersetzt werden soll, aber wenns nicht viele Nummern sind, kannste das ganze ja mit "Ersetzen.." machen ;)


(Geändert von Jack the Ripper um 12:24 am Juni 5, 2008)


-- Veröffentlicht durch The Papst am 17:13 am 4. Juni 2008

Ja, immer nach dem dritten Doppelpunkt bzw nach dem %:

Der Text kann mehrere Satzzeichen enthalten. Endet aber immer mit der Klammer.


-- Veröffentlicht durch Jack the Ripper am 16:23 am 4. Juni 2008

Hmm.. okay ich glaub das wird schwerer als ich dachte, da ja mehrere Nummern vorkommen und in dem wirren Text am Anfang auch noch Doppelpunkte sind.
Geht der Text denn immer genau nach dem 3. Doppelpunkt los?
Endet er immer nach dem ersten Punkt?


-- Veröffentlicht durch The Papst am 14:21 am 4. Juni 2008

Ein Kumpel hats grade versucht. Das ist wohl irgendwie komisch codiert oder so und dadurch spinnt das Prog rum, das er gebastelst hat.

Datei.rar

Hab die Datei ein bisschen geändert. Da wo die ganzen Xe sind, war vorher ein Name und da wo die Nullen sind, war ne Telefonnummer. Wäre gut, wenn man die Telefonnummer auch irgendwie rauskopieren und durch nen Namen ersetzen könnte, ist immer die letzte Nummer und wäre auch nur eine Nummer die ich ersetzen will. Die restlichen können soe bleiben.


-- Veröffentlicht durch TheOne am 13:28 am 4. Juni 2008

Naja gut Java ist 100% OOP... auch wenn ich das absolut schwachsinnig finde ALLES in eine Klasse zu haun und zu sagen es sei OOP :blubb: Denn Sinn verliert es dann trotdem :lol: ^^


-- Veröffentlicht durch Jack the Ripper am 12:06 am 4. Juni 2008

OOP ist klar ;)
Aber ich hätte es nicht wirklich dynamisch gemacht, also ließe sich das kaum auf andere Dateien/Probleme übertragen..

Ich glaub ich find heut sogar schon die Zeit dazu


-- Veröffentlicht durch TheOne am 7:37 am 4. Juni 2008

Mach aber bitte OOP und Strukturiert und schick mir den Code dann zu :lol: Eventuell findet sowas wieder verwendung. Ich bin eh grad nen Dateimanager am Basteln :)


-- Veröffentlicht durch Jack the Ripper am 1:42 am 4. Juni 2008

Könnte das morgen oder übermorgen mal mit Java machen, wenn bis dahin keine andere Lösung gefunden wurde, allerdings wären da einige Infos hilfreich:
Kann die Zeichenfolge am Anfang einen Doppelpunkt enthalten?
Kommen in den wirren Zeichen am Ende Ziffern vor?
Oder ist der Anfang der Telefonnummern irgendwie zu erkennen, außer dass eine Ziffer kommt?

Wenn es keine privaten Daten sind könnteste ja mal nen Beispieltext (gerne auch mit "Lorem ipsum") posten oder mir schicken, damit ich das ganze vor Augen hab..

(Geändert von Jack the Ripper um 1:52 am Juni 4, 2008)


-- Veröffentlicht durch Ino am 22:31 am 3. Juni 2008

ohh die alte gute linux konsolen programmierung mit dem cut befehl kannst du da auch so viel machen


-- Veröffentlicht durch Svenauskr am 19:29 am 3. Juni 2008

Unter Unix/Linux könntest du sed verwenden, aber unter Windows :dontknow:


-- Veröffentlicht durch The Papst am 16:58 am 3. Juni 2008

:nabend:

Ich habe eine große Anzahl an Datein mit teils relevanten und teils irrelevanten Inhalt. Ich würde gerne den relevanten Inhalt rausfiltern und in eine neue Textdatei einfügen.
Alle Files sind gleich aufgebaut. Es beginnt mit einer Zeichenfolge, die mit einem Doppelpunkt endet, danach kommt das was ich haben will. Der relevante Teil endet mit einer Klammer. Danach folgt nach ein paar wirren Zeichen noch eine Telefonnummer, die hätte ich auch noch ganz gerne mit drin.

Gibt es eine Möglichkeit ohne viel Aufwand so ein Script zu programmieren?

Hab leider schon ewig nichts mehr programmiert. Bin daher auf eure Hilfe angewiesen.


OCinside.de PC Forum
© 2001 - 2024 www.ocinside.de