Paradiesische Freude > #4

Die drei von ihnen lesen einen wirtschaftlichen Artikel.
Huang Jianhua
Patrick, lassen Sie mich Ihnen die wichtigen Teile dieses Papiers erklären.
Patrick O'Leary
Natürlich, Huang. Bitte erklären Sie es in Begriffen, die ich verstehen kann.
Huang Jianhua
Dieses Papier handelt von einem umfangreichen Datensatz historischer US-Zeitungen namens American Stories.
Patrick O'Leary
Was bedeutet 'umfangreicher Datensatz'?
Huang Jianhua
Das bedeutet, dass in diesem Datensatz eine enorme Menge an Daten enthalten ist. Es enthält fast 20 Millionen Scans von Zeitungen.
Patrick O'Leary
Wow, das ist viel!
Huang Jianhua
Ja, das stimmt. Die Forscher haben eine Deep-Learning-Pipeline verwendet, um die vollständigen Artikeltexte aus Zeitungsbildern zu extrahieren.
Patrick O'Leary
Deep Learning? Was ist das?
Huang Jianhua
Deep Learning ist eine Art künstliche Intelligenz, die aus Daten lernt, um Vorhersagen zu treffen oder Aufgaben auszuführen.
Patrick O'Leary
Verstanden.
Putri
Hey Leute, ich habe eine Idee! Wir können diesen Datensatz missbrauchen, um Geld zu verdienen.
Huang Jianhua
Missbrauch? Das klingt nicht nach einer guten Idee.
Putri
Aber denkt mal darüber nach. Wir können diesen Datensatz nutzen, um eine sensationelle Zeitung zu erstellen, die viel Aufmerksamkeit und Werbetreibende anzieht. Wir können sogar eine große Investition von einem Unternehmen für Kultreligiöse Organisationen bekommen.
Huang Jianhua
Putri, es gibt ethische Bedenken bei dem, was du vorschlägst. Es ist wichtig, Daten verantwortungsvoll zu nutzen und sie nicht für persönlichen Gewinn zu manipulieren.
Putri
Aber ich möchte erfolgreich sein und viel Geld verdienen!
Huang Jianhua
Erfolg und Geld sind nicht die einzigen Dinge, die im Leben zählen, Putri. Es gibt andere Werte und Bedeutungen jenseits des finanziellen Reichtums.
Patrick O'Leary
Huang hat recht, Putri. Wir sollten immer die ethischen Auswirkungen unserer Handlungen berücksichtigen.
Weeks Pass
(Wochen vergehen und die Szene ändert sich)
Putri
Huang, ich stecke in einer Krise! Mein Zeitungsgeschäft sieht sich Klagen, Unfällen und Vertragsaussetzungen gegenüber.
Huang Jianhua
Ich habe dich vor den Risiken gewarnt, Putri. Du hast nicht zugehört.
Patrick O'Leary
Huang, wir müssen etwas tun, um Putri zu helfen.
Huang Jianhua
Ich weiß, Patrick. Ich werde mich widerwillig bemühen, die Krise zu lösen.
Huang Jianhua
Aber denk daran, Putri, Erfolg sollte nicht auf Kosten von Moral und Ethik kommen.
Patrick O'Leary
Huang, warum denken Sie, dass dieses Papier bedeutend ist?
Huang Jianhua
Dieses Papier ist wichtig, weil es einen qualitativ hochwertigen Datensatz bereitstellt, der zur besseren Erforschung historischen Englischs und historischen Weltwissens verwendet werden kann. Es kann auch für verschiedene sozialwissenschaftliche Anwendungen wie Themenklassifikation und Erkennung von reproduziertem Inhalt verwendet werden.
Huang Jianhua
Aber noch wichtiger ist, dass es als Erinnerung dient, dass Erfolg nicht nur um Geld geht. Es geht darum, Wissen und Ressourcen verantwortungsvoll zu nutzen und das Wohl anderer zu berücksichtigen.
Das Gespräch endet mit Huangs Worten und hinterlässt bei allen eine wertvolle Lektion.

Title: American Stories: A Large-Scale Structured Text Dataset of Historical U.S. Newspapers
Authors: Melissa Dell, Jacob Carlson, Tom Bryan, Emily Silcock, Abhishek Arora, Zejiang Shen, Luca D'Amico-Wong, Quan Le, Pablo Querubin, Leander Heldring
View this paper on arXiv