PDMX und die Revolution der urheberrechtsfreien Musikdaten für die KI-gestützte Musikverarbeitung

Kategorien:
No items found.
Freigegeben:
September 18, 2024
Artikel

Einführung in PDMX: Ein Großangelegtes Public-Domain MusicXML-Dataset für Symbolische Musikverarbeitung

Die Entwicklung generativer KI-Musiksysteme hat zu zahlreichen Diskussionen über Urheberrechte an Daten, das Lizenzieren von Musik von Musikern und den Konflikt zwischen Open-Source-KI und großen renommierten Unternehmen geführt. Diese Themen verdeutlichen den Bedarf an öffentlich verfügbaren, urheberrechtsfreien Musikdaten, insbesondere im Bereich der symbolischen Musikdaten, von denen es einen erheblichen Mangel gibt. Um dieses Problem zu lindern, wird hier PDMX vorgestellt: ein großangelegtes Open-Source-Dataset von über 250.000 MusXML-Partituren aus dem öffentlichen Bereich, gesammelt von der Partitur-Sharing-Plattform MuseScore. Damit ist es nach aktuellem Kenntnisstand das größte verfügbare, urheberrechtsfreie, symbolische Musik-Dataset. PDMX enthält zudem eine Fülle von Tag- und Benutzerinteraktions-Metadaten, die eine effiziente Analyse des Datasets und eine Filterung nach qualitativ hochwertigen, von Benutzern generierten Partituren ermöglichen.

Die Bedeutung von Public-Domain-Daten in der Musikverarbeitung

Die jüngsten Fortschritte im Bereich der generativen KI-Musiksysteme haben die Notwendigkeit von urheberrechtsfreien Musikdaten verstärkt. Symbolische Musikdaten, wie sie in Partituren zu finden sind, bieten ein strukturiertes Format, das sich hervorragend für die algorithmische Musikgenerierung und -analyse eignet. Traditionell war es jedoch schwierig, große Mengen an urheberrechtsfreien symbolischen Musikdaten zu finden, was die Forschung und Entwicklung in diesem Bereich einschränkte.

Was ist MusicXML?

MusicXML ist ein weit verbreitetes Format für den Austausch von Notationsdaten zwischen verschiedenen Musiksoftware-Anwendungen. Es basiert auf XML (Extensible Markup Language) und ermöglicht eine detaillierte Beschreibung musikalischer Symbole wie Noten, Pausen, Taktstriche, Dynamiken und Artikulationen. MusicXML wurde entwickelt, um als universelles Format für die Speicherung von Musikdateien zu dienen und den Austausch zwischen verschiedenen Notationsprogrammen zu erleichtern. Ein Beispiel für die Kodierung einer halben Note E♭4 in MusicXML sieht wie folgt aus:

<note>
    <pitch>
        <step>E</step>
        <alter>-1</alter>
        <octave>4</octave>
    </pitch>
    <duration>2</duration>
    <type>half</type>
</note>

Die Entstehung von PDMX

Das PDMX-Dataset wurde durch das Herunterladen, Verarbeiten und Bereinigen von MusicXML-Partituren aus dem öffentlichen Bereich auf der Plattform MuseScore erstellt. MuseScore ermöglicht es Benutzern, Partituren hochzuladen und zu teilen, von denen viele in den öffentlichen Bereich fallen. Das PDMX-Dataset umfasst über 250.000 MusicXML-Partituren, was es zum größten verfügbaren urheberrechtsfreien symbolischen Musik-Dataset macht.

Metadaten und Qualitätssicherung

PDMX enthält eine Vielzahl von Metadaten, die eine detaillierte Analyse und Filterung ermöglichen. Dazu gehören:

- Tags - Benutzerinteraktionsdaten - Ratings

Diese zusätzlichen Metadaten ermöglichen eine effizientere Qualitätskontrolle und Filterung des Datasets, um sicherzustellen, dass nur hochwertige, von Benutzern generierte Partituren verwendet werden.

Anwendungsbeispiele und Experimente

Mit den zusätzlichen Metadaten konnten verschiedene Experimente zur Musikgenerierung durchgeführt werden. Dazu gehörten multitrack Musikgenerierungsexperimente, bei denen untersucht wurde, wie sich unterschiedliche repräsentative Subsets von PDMX auf das Verhalten nachgelagerter Modelle auswirken. Zudem konnte gezeigt werden, dass Benutzerbewertungen ein effektives Maß für die Datenqualität darstellen können.

Öffentlich verfügbare Ressourcen

PDMX bietet eine Vielzahl von öffentlich zugänglichen Ressourcen, die für Forschung und Entwicklung genutzt werden können:

- Dataset: https://zenodo.org/records/13763756 - Code: https://github.com/pnlong/PDMX/ - Demo: https://pnlong.github.io/PDMX.demo/

Fazit

Das PDMX-Dataset stellt einen bedeutenden Fortschritt im Bereich der symbolischen Musikverarbeitung dar. Durch die Bereitstellung eines großangelegten, urheberrechtsfreien Datasets können Forscher und Entwickler neue Algorithmen und Modelle entwickeln, die auf hochwertigen, öffentlich verfügbaren Daten basieren. Dies wird letztendlich die Forschung und Entwicklung in der Musikverarbeitung vorantreiben und neue Möglichkeiten für die Musikgenerierung und -analyse eröffnen.

Bibliographie

https://arxiv.org/html/2406.11462v1 https://www.musicxml.com/music-in-musicxml/ https://arxiv.org/abs/2306.13512 https://proceedings.neurips.cc/paper_files/paper/2023/file/aa7ef4c0f4aaabf376088a1a74e09d4c-Paper-Datasets_and_Benchmarks.pdf https://www.audiolabs-erlangen.de/resources/MIR/FMP/C1/C1S2_MusicXML.html https://apacha.github.io/OMR-Datasets/ https://archives.ismir.net/ismir2021/paper/000022.pdf https://aclanthology.org/2021.findings-acl.70.pdf
Was bedeutet das?