Skip to content

bright-data-de/Reddit-dataset-samples

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

6 Commits
 
 
 
 
 
 

Repository files navigation

Reddit-dataset-samples

Ein Beispiel-Datensatz mit 1001 Reddit-Posts

Reddit posts dataset header

Ein Reddit-Datensatzbeispiel mit über 1000 Datensätzen. Der Datensatz wurde mit der Bright Data API extrahiert.

Einige der Datenpunkte, die im Reddit-Datensatz enthalten sind:

  • post_id: Post-ID
  • url: URL des Posts
  • user_posted: Benutzername des Post-Erstellers
  • title: Titel des Posts
  • description: Textbeschreibung des Posts
  • num_comments: Anzahl der Kommentare
  • date_posted: Veröffentlichungsdatum des Posts
  • community_name: Name der Community
  • num_upvotes: Anzahl der Upvotes
  • photos: URLs der angehängten Fotos
  • videos: URLs der angehängten Videos
  • tag: Name des Tags

Und vieles mehr.

Dies ist ein Beispiel-Subset, das aus dem Datensatz „Reddit posts“ abgeleitet ist, der mehr als 404K Datensätze umfasst.

Verfügbare Datensatz-Dateiformate: JSON, NDJSON, JSON Lines, CSV oder Parquet. Optional können Dateien zu .gz komprimiert werden.

Optionen für den Datensatz-Bereitstellungstyp: Email, API download, Webhook, Amazon S3, Google Cloud storage, Google Cloud PubSub, Microsoft Azure, Snowflake, SFTP.

Aktualisierungsfrequenz: Einmalig, täglich, wöchentlich, monatlich, vierteljährlich oder auf individueller Basis.

Datenanreicherung ist als Ergänzung zu den extrahierten Datenpunkten verfügbar: Auf Anfrage.

Holen Sie sich den vollständigen Reddit-Datensatz.

Welche Anwendungsfälle gibt es für die Reddit-Datensätze?

1. Sentiment-Analyse

Überwachen Sie die Verbraucherstimmung, indem Sie Online-Konversationen auf Reddit analysieren, um die Markenreputation zu verfolgen und auf Kundenfeedback zu reagieren.

2. Trendidentifikation

Identifizieren Sie branchenbezogene Trends und Themen auf Reddit, um die Entwicklung von Marketinginhalten und Kampagnen zu unterstützen.

3. Wettbewerbsanalyse

Verbessern Sie die Competitive Intelligence, indem Sie die Reddit-Aktivität ähnlicher Marken analysieren, um Möglichkeiten zur Verbesserung aufzudecken.

Kostenloser Zugang zu Web-Scraping-Tools und Datensätzen für akademische Forschende und NGOs

Die Bright Initiative bietet führenden akademischen Fakultäten und Forschenden, NGOs und NPOs, die verschiedene Umwelt- und Sozialanliegen fördern, Zugang zu Bright Data Web Scraper APIs und einsatzbereiten Datensätzen. Sie können hier einen Antrag einreichen.

About

Ein Beispieldatensatz mit über 1000 Reddit-Posts, extrahiert mit der Bright Data API, ideal für Sentiment-Analyse, Verbrauchermonitoring, Trendidentifikation und Wettbewerbsanalyse.

Topics

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

 
 
 

Contributors