WASEO-Dictionary++ 16MB Version veröffentlicht


WASEO-Dictionary++ 16MB Version veröffentlicht

von mp-one » Mo 22. Feb 2010, 23:49
Hallo Bit Byter,

endlich habe ich es geschafft, die große Version des WASEO-Dictionary++ fertigzustellen. Sie enthält 300.000 Wörter (150.000 je Sprache) und kommt auf einem 16MB ATR Image.

Vielen Dank an GoodByteXL, der mit Tips und Anregungen geholfen und unendlichen Testreihen sein MSC zum Glühen gebracht hat. Weiterhin an Charlie Chaplin für die XL/XE DVDs und die BASIC XL-Runtime, an Stephen J. Carden, der mir eine Site-Lizenz von Real.DOS für das Dictionary zur Verfügung gestellt hat sowie alle, die geholfen haben.

Die Dateien sowie weitere Informationen gibt es unter:

http://www.atari-computing.de/software/waseo/dictionary


Ich wünsche Euch viel Spaß mit dem Programm!

Gruß,

Michael/WASEO
dictvid.gifdictvid.gif

Re: WASEO-Dictionary++ 16MB Version veröffentlicht

von mp-one » Di 23. Feb 2010, 14:36
...noch eine Ergänzung:

Um die Textdateien auf dem Image anzuschauen, könnt Ihr statt "TYPE filename.txt" den Befehl "COPY filename.txt E:" verwenden. TYPE unterstützt zur Zeit nur Zeilen mit maximal 40 Zeichen Länge.

Re: WASEO-Dictionary++ 16MB Version veröffentlicht

von Rockford » Di 23. Feb 2010, 19:03
Hab's runtergeladen und gleich mal durchgetestet. Ist richtig flott und hat soeben mein Universalwörterbuch ersetzt: Handlicher, schneller, besser.

Danke für diese Software! :danke3

Gruss, Holger

Re: WASEO-Dictionary++ 16MB Version veröffentlicht

von mp-one » Di 23. Feb 2010, 21:28
Rockford hat geschrieben:Hab's runtergeladen und gleich mal durchgetestet. Ist richtig flott und hat soeben mein Universalwörterbuch ersetzt: Handlicher, schneller, besser. Danke für diese Software! :danke3 Gruss, Holger


Hi Holger,

danke für das positive Feedback. Falls Du es nicht schon so gemacht hast: die maximale Speed kannst Du auf dem Emu erreichen, wenn Du SDX 4.42 als CAR File als Modul (ALT+R in Atari800Win) einbindest. Dict++ sucht dann nur noch ca. 2,6 Sekunden statt 6 Sekunden.

Gruß,

Michael

Re: WASEO-Dictionary++ 16MB Version veröffentlicht

von GoodByteXL » Mi 24. Feb 2010, 08:46
mp-one hat geschrieben:... wenn Du SDX 4.42 als CAR File als Modul (ALT+R in Atari800Win) einbindest. Dict++ sucht dann nur noch ca. 2,6 Sekunden

:):):)

Die 16MB-Version ist ein Hammer. Auf PBI-IDE mit Compact Flash ist sie kaum langsamer als im Emu,

und

auf echter A8-Hardware wie im Emulator ist SpartaDOS X top,

und

die SIO2XX-Geräte machen solche hochklassigen Programmpakete nutzbar

:danke3 an alle Programmierer und Entwickler.

Meeeehr davon - denn so macht der XL richtig Spaß !

Re: WASEO-Dictionary++ 16MB Version veröffentlicht

von atarixle » Mi 24. Feb 2010, 13:44
also alle Achtung, die Suchergebnisse sind echt brutal schnell da, dafür, dass der kleine 8-Bitter 16 MB Daten umzukrempeln hat.

Re: WASEO-Dictionary++ 16MB Version veröffentlicht

von mp-one » Fr 26. Feb 2010, 10:59
atarixle hat geschrieben:also alle Achtung, die Suchergebnisse sind echt brutal schnell da, dafür, dass der kleine 8-Bitter 16 MB Daten umzukrempeln hat.


Hi Mirko,

jedes Dictionary-File (es gibt zwei: DE-EN, EN-DE) hat ca. 5 Mb. Der eigentliche Dampfmacher dabei ist die binäre Suche. Bei den 150.000 Worten pro Sprache, braucht er im Mittel nur ca. 15-18 relative Sprünge bis er das Wort hat. Die Liste muss allerdings vorsortiert sein, damit das klappt. Außerdem braucht man ein DOS, das in der Lage ist, "echt" relativ zu Positionieren, also ein beliebiges Byte und nicht Sektor+Byte anzuspringen. Das geht derzeit nur mit SpartaDOS 3.x, SD X 4.x und RealDOS. BeWeDOS kann es zwar auch, aber leider nur unbrauchbar langsam. Ansonsten wäre es top, da es als einziges mit TBXL funktioniert. So musste ich auf BASIC XL + Runtime ausweichen, was aber auch super ist.

Gruß,

Michael

Re: WASEO-Dictionary++ 16MB Version veröffentlicht

von atarixle » Fr 26. Feb 2010, 13:01
Das mit der binären Suche dachte ich mir schon fast ... das mit den relativen Zugriffen unter SpartaDOS ist somit ja eine echt feine Sache. Und dieses Dictionary ist eine echt sinnvolle Anwendung dafür. Die kann ich gut gebrauchen, wann immer mir dict.leo.org nicht zur Verfügung steht.

Ich muss auch sagen, es sind echt viele Begriffe vorhanden, also bisher sind auch ziemlich exotische Sachen gefunden worden. Also Wörter weit jenseits von "Computer", "Internet" und "Email" ... :)

Re: WASEO-Dictionary++ 16MB Version veröffentlicht

von mp-one » Sa 27. Feb 2010, 11:01
atarixle hat geschrieben:Ich muss auch sagen, es sind echt viele Begriffe vorhanden, also bisher sind auch ziemlich exotische Sachen gefunden worden. Also Wörter weit jenseits von "Computer", "Internet" und "Email" ... :)


Hi,

ja, es ist schon verhältnismäßig umfangreich, auch wenn es noch wesentlich gößere Dictionaries gibt. Problem hierbei war, eine Liste zu finden, die frei verwendbar ist. Die Liste des DING-Projekts war die einzige, die ich da bisher gefunden habe.

Da sie von vielen Leuten "gepflegt" wird, enthält sie teilweise merkwürdige Einträge und evtl. auch Fehler(?). Ich habe leider nicht die Zeit, das inhaltlich zu überarbeiten. Aber falls jemand, der das Dict++ nutzt, was findet und Lust hat es zu korrigieren, sende ich gerne die ASCII-Files. Die Mithilfe der User ist hier angesagt.

Gruß

Re: WASEO-Dictionary++ 16MB Version veröffentlicht

von eda70 » Fr 5. Mär 2010, 16:37
Nur ne kurze Frage, wie hast du das Problem gelöst, dass beim Vergleich (in der binsuche) von beispielsweise "Bürger" und "Bank" Bank als kleiner erkannt wird? Im Suchvorgang das Ü durch U ersetzt?

Zu den Point-Befehlen. Es geht auch mit POINT sec,byte unter bspw. MyDOS nur nicht so komfortabel...
Läuft auch unter MyDOS recht flott, da ja pro Suche nur ein paar Lesevorgänge nötig sind.

Ansonsten ne sehr feine Sache. Schade, dass es nicht auf meinem Mobile läuft.
Wie hast du übrigens die Wörterbuch-Daten für die 128k-Version selektiert? Worthäufigkeit?

Re: WASEO-Dictionary++ 16MB Version veröffentlicht

von mp-one » Fr 5. Mär 2010, 23:20
Hallo,

eda70 hat geschrieben:Nur ne kurze Frage, wie hast du das Problem gelöst, dass beim Vergleich (in der binsuche) von beispielsweise "Bürger" und "Bank" Bank als kleiner erkannt wird? Im Suchvorgang das Ü durch U ersetzt?


Genau, es wird eine angepasste Vergleichsfunktion benutzt. Eine Assembler-Routine ersetzt vor dem Vergleich temporär Ü durch U usw.. Für die Bildschirmausgabe wird aber der String mit den Umlauten verwendet.

Zu den Point-Befehlen. Es geht auch mit POINT sec,byte unter bspw. MyDOS nur nicht so komfortabel...
Läuft auch unter MyDOS recht flott, da ja pro Suche nur ein paar Lesevorgänge nötig sind.


Evtl. ja, dazu müsste man aber wissen, an welcher Sektor-/Byte-Position sich z.B. das Byte-Nr. 2.456.432 befindet. Man könnte das zwar berechnen oder einen Index führen, aber wenn man dann auf ein anderes evtl. nicht ganz leeres oder anders organisiertes (Sektorgrößen..) Image kopiert, muss alles wieder neu berechnet werden. Außerdem ist MyDOS beim Disk-I/O deutlich langsamer als SpartaDOS oder RealDOS (nur BeWeDos ist noch lahmer). Kurzum, praktikabel und schnell waren nur SD und RealDOS.

Wie hast du übrigens die Wörterbuch-Daten für die 128k-Version selektiert? Worthäufigkeit?


Bei der ersten Version ging es einfach nach der Wortlänge, alles was langer war als 20 Zeichen (glaube ich), flog raus. Das Ergebnis war aber unbefriedigend. Die Liste der 1.03er Version auf der Homepage habe ich an einem recht laaangen Abend per Hand gemacht :D !

Gruß