Das Experiment: Genres an der Wortwahl erkennen

Alles frisch von der Leber talken, Hauptsache es ist Fantasy, Science-Fiction, Horror oder Du glaubst, es wäre welches.
Antworten
Benutzeravatar
Hexodus
Beiträge: 2211
Registriert: Di 27. Okt 2009, 16:31

Das Experiment: Genres an der Wortwahl erkennen

Beitrag von Hexodus » Fr 19. Okt 2012, 11:20

Eine verrückte Idee: man nehme einen Klappentext+Titel und analysiert die Wortwahl, um das Genre zu erkennen. Der Hintergrund dazu ist der, dass ich gerne ein Script schreiben möchte, das in der Lage sein wird anhand des Klappentextes das Genre vorher zu sagen :ugeek:

Gibt es bestimmte Begriffe, die eine automatische Zuordnung zu einem Bestimmten Genre erlauben? Lasst uns mal kurz die Köpfe zusammen stecken.

Ich probiere das mal aus. Ein Buch ist einem bestimmten Genre zuzuordnen, wenn es ein oder mehrere der folgenden Schlagworte enthält (alles Einzahl).

FANTASY:
Drache, Schwert, Fantasy, Zwerg, Elf, Magie, Zauberspruch, Imperium, Krieger, Prophezeiung, Tolkien, Labyrinth, Kaiser, Legende, Ritter

SCIENCE FICTION:
Raumschiff, Weltall, Sterne, Schleuse, Raumanzug, Plasma, Laser, Dimension, Vakuum, Jedi, Klon, Parallelwelt, Laptop, Computer, Elektronen, Physik, Wissenschaft, Zukunft, Galaxis, Planet, Universum

HORROR:
Horror, Zombie, Gedärme, Schädel, Vampir, Dämon, Hölle, höllisch, Werwolf, Jenseits, Kannibalismus, Teufel, Engel, Seele, Dunkelheit, Dunkel, Dunkle Gruft, Fluch, Stephen King, verdammt, Verdammten, Monster, Wolf


Könnt ihr mir weitere Keywords liefern und vielleicht auch auf andere Genres ausweiten?

Benutzeravatar
Hexodus
Beiträge: 2211
Registriert: Di 27. Okt 2009, 16:31

Re: Das Experiment: Genres an der Wortwahl erkennen

Beitrag von Hexodus » Fr 19. Okt 2012, 11:31

Hier noch die Liste der Genres zur Übersicht, die wir ausgearbeitet haben.
FANTASY
high, low (sword & sorcery), urban, animal, dark, all age, humoristische, social, gaslight
SCIENCE FICTION
hard, soft, utopie, dystopie, steampunk, cyberpunk, alternativwelt, military, space opera, zeitreise, social
HORROR
grussel, splatter/gore, gothic/schauerroman, paranormal, satanic, torture
ROMANCE
urban, dark, fantasy, sf, paranormal

Benutzeravatar
harakiri
Beiträge: 1427
Registriert: Do 2. Feb 2012, 13:01

Re: Das Experiment: Genres an der Wortwahl erkennen

Beitrag von harakiri » Fr 19. Okt 2012, 12:01

da muss ich mal länger drüber nachdenken :geek:

zu Horror vielleicht mal: spritzendes Blut, Axt, Schreie

Benutzeravatar
Lanara
Beiträge: 1351
Registriert: Di 31. Jan 2012, 19:40

Re: Das Experiment: Genres an der Wortwahl erkennen

Beitrag von Lanara » Fr 19. Okt 2012, 13:31

Fantasy:

Hexen, Hexer, Zauberei, Magie
Kaffee dehydriert den Körper nicht - ich wäre sonst schon Staub!

Benutzeravatar
Shining
Beiträge: 1414
Registriert: Di 27. Okt 2009, 18:22

Re: Das Experiment: Genres an der Wortwahl erkennen

Beitrag von Shining » Fr 19. Okt 2012, 15:03

daa daa daa daada daaaa daada daaaa daaaa.... also Imperium definitiv zu SF.
"Ich mag Feuer - setzt Wärmeenergie frei und macht schönes Licht."
(Ich)

Benutzeravatar
Nazena
Beiträge: 338
Registriert: So 12. Feb 2012, 13:19

Re: Das Experiment: Genres an der Wortwahl erkennen

Beitrag von Nazena » Fr 19. Okt 2012, 15:35

In Bezug auf Horror nicht einfach. Sehr viele Engel/ Seele etc. Bücher sind nämlich Romantic Fantasy und ganz klar kein Horror (wobei funkelnde Vampire ein ganz eigener Horror für sich sind...).
In Anbetracht des Buchmarktes sollte man vielleicht noch eine Sparte namens "Romantic Fiktion/ Romantasy" oder ähnlich einführen, egal ob Nackenbeißer, SF oder Fantasy. Dort ist nämlich die Romanze das Hauptgenre und Vampire, Werwölfe und Konsorten (wie neuerdings auch Aliens) eher schmückendes Beiwerk.

Benutzeravatar
Mystera
Beiträge: 1290
Registriert: Do 2. Feb 2012, 11:34

Re: Das Experiment: Genres an der Wortwahl erkennen

Beitrag von Mystera » Fr 19. Okt 2012, 18:44

Fantasy: Sage, Mähr, Legende, Mythos, Kult, Ritus, Verwandlung, Bann
Horror: Mörder, Unheimlich, beängstigend, Tod, Panik, Geist, Phantom
Gefährlich ist's, den Leu zu wecken,
Verderblich ist des Tigers Zahn,
Jedoch der schrecklichste der Schrecken,
Das ist der Mensch in seinem Wahn. (Schiller)

http://www.buechertreff.de/user/13191/buecherregal/

Benutzeravatar
Shining
Beiträge: 1414
Registriert: Di 27. Okt 2009, 18:22

Re: Das Experiment: Genres an der Wortwahl erkennen

Beitrag von Shining » Fr 19. Okt 2012, 21:41

wieso gehst Du das nicht von der anderen Seite an? Parse den ganzen Klappentext nach Wörtern, die länger als sagen wir 3 oder 4 Buchstaben sind (oder Wörter, die mit Großbuchstaben beginnen oder auf lich und end enden) und entscheide die ersten 100 Klappentexte (gut gemischt durch alle Genres) selbst. Anschliessend hast Du eine Wortgrundlage für jedes Genre, mit der Du das Programm entscheiden lassen kannst. Du greifst dann nur noch ein, wenn das Genre korrigiert werden muss... wobei das Programm die Grundlage immer mehr erweitert und zudem ab einer gewissen Korrekturrate Wörter selbständig einem anderen Genre zuordnet.


... und dann lernt es mit geometrischer Geschwindigkeit, entwickelt ein eigenes Bewusstsein, nennt sich Skynet und baut komische Roboter, die wie Arnold aussehen.

Shining
Cyberdyne Systems
"Ich mag Feuer - setzt Wärmeenergie frei und macht schönes Licht."
(Ich)

Benutzeravatar
Hexodus
Beiträge: 2211
Registriert: Di 27. Okt 2009, 16:31

Re: Das Experiment: Genres an der Wortwahl erkennen

Beitrag von Hexodus » Sa 20. Okt 2012, 14:53

Shining hat geschrieben: ... und dann lernt es mit geometrischer Geschwindigkeit, entwickelt ein eigenes Bewusstsein, nennt sich Skynet und baut komische Roboter, die wie Arnold aussehen.
Shining
Cyberdyne Systems
Genau wegen diesem Teil wollte ich das vermeiden :| Ich mache das tatsächlich in etwa so, wie Du das vorgeschlagen hast, nur abgewandelt. Ich schaue mir Klappentexte an
und versuche die vorhandenen Keywords heraus zu finden, die mich zu einer Genrezuordnung bewegen würden. Diese wandern in eine Tabelle und bekommen je nach Eindeutigkeit einen Wert zwichen 0.1 bis 1.0 zugeordnet. Habe ich genug Keywords zusammen, kann ich die Wertigkeit der Einzelnen Keywords pro Genre ermitteln und miteinander vergleichen. Sicherlich kommen dabei ebenfalls Mischergebnisse heraus z.B. 60%Fantasy zu 40% Romance = Romantasy. Ob das so eindeutig sein wird, werde ich im Test ermitteln müssen.

Benutzeravatar
Shining
Beiträge: 1414
Registriert: Di 27. Okt 2009, 18:22

Re: Das Experiment: Genres an der Wortwahl erkennen

Beitrag von Shining » Sa 20. Okt 2012, 19:50

ahh... interessant. Wieso so kompliziert und nicht einfach zählen wie oft ein Wort in einem Genre vorkommt? Die Gewichtung für die Genres würde dann doch automatisch ermittelt werden. Natürlich dürfte man nicht alle Wörter nehmen, da das System sonst irgendwann nicht mehr performant arbeiten kann - wieviele Wörter hat die deutsche Sprache? - , aber dafür kann man ja ein Filter vorschalten, der nur Nomen, Adjektive, Adverben etc. durchlässt. Der Vorteil liegt meines Erachtens darin, dass Du Dir wegen Keywörtern gar keine Gedanken machen musst, die enstehen beim Verarbeiten der Klappentexte von allein.
"Ich mag Feuer - setzt Wärmeenergie frei und macht schönes Licht."
(Ich)

Antworten