Reddit hat seine API geschlossen um das Aufbauen von Datenbanken für Sprachmodelle zu verhindern. Da stellt sich die Frage: wie steht das Fediverse und insbesondere Lemmy dazu? Dürfte ich für einen freien Assistenten (z.B. für https://open-assistant.io/) Datensätze auf Basis der subs hier auf Lemmy zusammenstellen?

  • nottheengineer@feddit.de
    link
    fedilink
    arrow-up
    4
    arrow-down
    1
    ·
    1 year ago

    Es ist ein öffentliches Forum, daher kein Problem. Reddit glaubt, die Nutzerdaten zu besitzen und dafür Geld verlangen zu dürfen. Hier glaubt das niemand, die Daten werden frei zwischen Instanzen verteilt.

    Bei großen Datenmengen würde ich aber mit den Admins in Kontakt treten, sonst kann durch scraping schon mal die ganze Instanz in die Knie gehen.

    • Glowing Lantern@feddit.de
      link
      fedilink
      arrow-up
      4
      ·
      edit-2
      1 year ago

      Obwohl, meistens wenn nichts weiteres angegeben ist, behält der Urheber alle Rechte. Steht irgendwo in den AGBs, dass alles ins Public Domain übertragen wird? Gibt es solche AGBs überhaupt? Das wäre vor allem bei längeren Posts oder Aufsätzen interessant.

      • aard@feddit.de
        link
        fedilink
        arrow-up
        2
        ·
        1 year ago

        Public Domain existiert in Deutschland nicht.

        Die meisten Beitraege hier duerften aber die Schoepfungshoehe die fuer urheberrechtlichen Schutz noetig ist nicht erreichen.