Top-Themen

Aktuelle Themen (A bis Z)

Administrator.de FeedbackApache ServerAppleAssemblerAudioAusbildungAuslandBackupBasicBatch & ShellBenchmarksBibliotheken & ToolkitsBlogsCloud-DiensteClusterCMSCPU, RAM, MainboardsCSSC und C++DatenbankenDatenschutzDebianDigitiales FernsehenDNSDrucker und ScannerDSL, VDSLE-BooksE-BusinessE-MailEntwicklungErkennung und -AbwehrExchange ServerFestplatten, SSD, RaidFirewallFlatratesGoogle AndroidGrafikGrafikkarten & MonitoreGroupwareHardwareHosting & HousingHTMLHumor (lol)Hyper-VIconsIDE & EditorenInformationsdiensteInstallationInstant MessagingInternetInternet DomäneniOSISDN & AnaloganschlüsseiTunesJavaJavaScriptKiXtartKVMLAN, WAN, WirelessLinuxLinux DesktopLinux NetzwerkLinux ToolsLinux UserverwaltungLizenzierungMac OS XMicrosoftMicrosoft OfficeMikroTik RouterOSMonitoringMultimediaMultimedia & ZubehörNetzwerkeNetzwerkgrundlagenNetzwerkmanagementNetzwerkprotokolleNotebook & ZubehörNovell NetwareOff TopicOpenOffice, LibreOfficeOutlook & MailPapierkorbPascal und DelphiPeripheriegerätePerlPHPPythonRechtliche FragenRedHat, CentOS, FedoraRouter & RoutingSambaSAN, NAS, DASSchriftartenSchulung & TrainingSEOServerServer-HardwareSicherheitSicherheits-ToolsSicherheitsgrundlagenSolarisSonstige SystemeSoziale NetzwerkeSpeicherkartenStudentenjobs & PraktikumSuche ProjektpartnerSuseSwitche und HubsTipps & TricksTK-Netze & GeräteUbuntuUMTS, EDGE & GPRSUtilitiesVB for ApplicationsVerschlüsselung & ZertifikateVideo & StreamingViren und TrojanerVirtualisierungVisual StudioVmwareVoice over IPWebbrowserWebentwicklungWeiterbildungWindows 7Windows 8Windows 10Windows InstallationWindows MobileWindows NetzwerkWindows ServerWindows SystemdateienWindows ToolsWindows UpdateWindows UserverwaltungWindows VistaWindows XPXenserverXMLZusammenarbeit

gelöst Java Suchmaschine

Mitglied: Praktikantin

Praktikantin (Level 1) - Jetzt verbinden

09.10.2007 um 12:41 Uhr, 6208 Aufrufe

zum laufen bringen

Hallo zusammen,
ich habe 7 verschiedene Java codes die hier zu finden sind: http://rapidshare.com/files/61318562/ji.tar.gz
Ich habe diesen Code auf einer Homepage einer Universität gefunden und war mehr als begeistert, da ich selbst so etwas gesucht habe und es ist wirklich klasse so ein fertiges IR System zu finden. Man bekommt eine Idee wie das alles läuft (Theorie ist gut Praxis ist besser). Ich will es zum laufen bringen aber irgendwie schaffe ich es nicht. Der Code ist zu hoch für mich und ich bin mehr als verloren. Was das Programm eigentlich machen soll:

Die klassische Implementierung eines IR-Systems funktioniert so, dass man die
Dokumente liest, in Wörter zerhackt, die Wörter zählt, und das alles in sogenannten
invertierten Listen abspeichert. Die invertierte Liste zum Term ti
enthält eine Liste aller Dokumentnummern, in denen der Term vorkommt. Bei
gewichteter Indexierung steht bei jeder Dokumentnummer auch noch dabei, mit
welchem Gewicht der Term in diesem Dokument versehen ist.
Man braucht also diverse Datenstrukturen:
1. Das Wörterbuch (dictionary) ordnet jedem Term eine Nummer zu, der
Rest des Systems verwendet nur die Nummer. Außerdem werden hier weitere
globale Daten zu jedem Term gespeichert, wie beispielsweise die document frequency (Anzahl Dokumente, die diesen Term enthalten).
2. Die Dokumentliste ordnet jedem Dokument eine Nummer zu. Ferner
können dokumentspezi_sche Daten hier abgelegt werden, beispielsweise
die Dokumentlänge.
3. Das inverted file enthält die invertierten Listen zu jedem Term, die oben
schon beschrieben wurden.
Das System besteht dann aus zwei hauptsächlichen Komponenten:
1. Der Indexer liest die Dokumente und baut die o.g. Datenstrukturen auf.
2. Der query processor nimmt eine Anfrage entgegen und liest die o.g.
Datenstrukturen und berechnet das Anfrageergebnis.

Hier eine Link zu der ganzen Aufgabe: http://rapidshare.com/files/61318729/09.pdf
Ich will das Programm einfach zu laufen bringen und es für cacm.all Sammlung benutzen: http://rapidshare.com/files/59055129/cacm.tar.gz
Die Java Klassen sind: Dictionary (erstellt das Wörterbuch), DV (splittet die Dokumente und erstellt wahrscheinlich einen Index, Indexer.java, Query (für die Abfragen, das Arciv befindet sich auf das cacm Archiv (Querl.txt (oder so ähnlich)), Search (für die Suche) und Stemmer.java für das Stemming. Ich will euch bitten mir weiterzuhelfen… Ich weiß wirklich nicht mehr weiter und bis ich das alles von selbst löse dauert es eine Ewigkeit. Seht euch die Codes an und ändert alles was nötig ist damit es auf meinem PC läuft. Die cacm Datei befindet sich auf c:\cacm\cacm.all, der Index und das Dictionary sollen jeweils auf C:\Index und C:\dict gespeichert werden und wenn der code DV.java läuft und die Dokumente von cacm.all trennt sollen die auf c:\docs gespeichert werden . Der code befindet sich aud C:\ji. Ich weiß jetzt nicht mehr was noch benötigt wird. Es wäre toll wenn auf Search.java ein Eingabe Feld erscheint und wir dort unsere Frage stellen können… Muss ich außerdem ein Packet erstellen? Ich bin für jede Hilfe mehr als dankbar.

Viele liebe Grüße
Julia
Ähnliche Inhalte
Java
Java konsole per java befehl einblenden
gelöst Frage von deinernstjetztJava6 Kommentare

Hallo, ich habe eine Konsolenanwendung programmiert, allerdings ist das Problem, das man diese nicht mit klick auf das .jar ...

Java
Java kompilieren
Frage von ZockervogelJava5 Kommentare

Hallo, leider habe ich überhaupt keine Ahnung von dem was ich jetzt schreibe :-) Ich habe hier ein .jar ...

Java
Quelltext - Java
Frage von jajatvJava2 Kommentare

Hallo liebes Forum, ich habe ein Frage und zwar suche ich einen Code wie ich von mehreren Seiten, den ...

Windows Netzwerk
Java APPDATA
Frage von katalinbuchWindows Netzwerk1 Kommentar

Hallo zusammen, ich habe ein Prolpem mit "umgeleiteten" Ordner APPDATA. aus Gründen der Geschwindigkeit mustten wir in einer 2012R2 ...

Neue Wissensbeiträge
Humor (lol)
Administrator.de Perlen
Tipp von DerWindowsFreak2 vor 4 TagenHumor (lol)6 Kommentare

Hallo, Heute beim stöbern auf dieser Seite bin auf folgenden Thread aus dem Jahre 2006 gestossen: Was meint ihr? ...

Erkennung und -Abwehr
OpenSSH-Backdoor Malware erkennen
Tipp von Frank vor 5 TagenErkennung und -Abwehr

Sicherheitsforscher von Eset haben 21 Malware-Familien untersucht. Die Malware soll Hintertüren via OpenSSH bereitstellen, so dass Angreifer Fernzugriff auf ...

iOS
WatchChat für Whatsapp
Tipp von Criemo vor 8 TageniOS5 Kommentare

Ziemlich coole App für WhatsApp User in Verbindung mit der Apple Watch. Gibts für iOS sowohl als auch für ...

iOS
IOS hat nen Cursor!
Tipp von Criemo vor 9 TageniOS5 Kommentare

Nette Funktion im iOS. iPhone-Mauszeiger aktivieren „Nichts ist nerviger, als bei einem Tippfehler zu versuchen, den iOS-Cursor an die ...

Heiß diskutierte Inhalte
Samba
Windows 10 Client in Samba-Domäne hinzufügen scheitert
Frage von diwaffmSamba31 Kommentare

Hi Leute, ich habe einen Samba Server in der Version 4.9.3 auf einer OpenSuse Maschine laufen. Damit sind momentan ...

Windows Systemdateien
Verknüpfungen nach Pfadwechsel
Frage von Hendrik2586Windows Systemdateien17 Kommentare

Guten Morgen meine lieben Kollegen und Kolleginnen, ich hab da mal eine Frage die Ihr sicher schon kennt. Es ...

Batch & Shell
CMD-Fenster nach Task schließen
gelöst Frage von Hyperlink.93Batch & Shell16 Kommentare

Hallo, ich habe ein Skript was über einen Task bei jeder User Anmeldung läuft. Der Task startet eine CMD ...

Netzwerkmanagement
Sehr langsame Netzverbindung in einem bestimmten Subnet
gelöst Frage von gabeBUNetzwerkmanagement15 Kommentare

Hallo Zusammen Ich habe das folgende Problem: Unser Netzwerk, dass aus verschiedenen Subnetzwerken aufgebaut ist, ist nicht in jedem ...