Wasserflasche
Blogger
Ich möchte bei meinem Script versuchen, automatisiert Websites zu kategorisieren.
Wie würdet ihr das realisieren?
Mir fällt bisher nur eine mühsame Lösung ein:
Für jede Kategorie endlos viele Stichwörter definieren
(z.B.
Sport: Fussball, Handball, Ergebnis, Bundesliga etc.
Programmierung: Python, PHP, C++, Webframework etc.
....)
und dann prüfen, ob man eins dieser Wörter im Quelltext findet und dann dementsprechend die Kategorie zuordnet.
Wenn er nichts findet -> Kategorie Sonstiges
Habt ihr nen besseren Weg im Kopf ?
Wie würdet ihr das realisieren?
Mir fällt bisher nur eine mühsame Lösung ein:
Für jede Kategorie endlos viele Stichwörter definieren
(z.B.
Sport: Fussball, Handball, Ergebnis, Bundesliga etc.
Programmierung: Python, PHP, C++, Webframework etc.
....)
und dann prüfen, ob man eins dieser Wörter im Quelltext findet und dann dementsprechend die Kategorie zuordnet.
Wenn er nichts findet -> Kategorie Sonstiges
Habt ihr nen besseren Weg im Kopf ?