JSONL / JSON Lines-Formatierer

Validieren und formatieren Sie JSONL (JSON Lines / NDJSON) Dateien, bei denen jede Zeile ein JSON-Objekt ist. Nützlich für Machine-Learning-Datensätze, Protokolldateien und Streaming-Daten.

JSONL Input (one JSON object per line)

4 valid records

Table View

#	id	name	role	active
1	1	Alice	developer	true
2	2	Bob	designer	true
3	3	Carol	manager	false
4	4	Dave	developer	true

So verwenden Sie JSONL / JSON Lines-Formatierer

1Fügen Sie Ihren JSONL-Inhalt ein (ein JSON-Objekt pro Zeile).
2Zeigen Sie Validierungsergebnisse für jede Zeile mit Fehlerhervorhebung an.
3Konvertieren Sie zwischen JSONL und JSON-Array-Format, oder komprimieren/Pretty-Print jeden Datensatz.

ZenovayAnalytics

Sehen Sie, wer gerade auf Ihrer Seite ist.

Besucher-Tracking in Echtzeit
Datenschutz zuerst, kein Cookie-Banner
In zwei Minuten eingerichtet

Zenovay entdecken

Häufig gestellte Fragen

Was ist JSONL (JSON Lines)?▾

JSONL (JSON Lines) ist ein Textformat, bei dem jede Zeile ein gültiger JSON-Wert ist (normalerweise ein Objekt). Auch bekannt als NDJSON (Newline Delimited JSON) oder JSON Lines. Regeln: jede Zeile ist ein vollständiges, gültiges JSON-Objekt. Linien werden durch Zeilenumbrüche (\n) getrennt. Kein nachfolgendes Komma zwischen Linien. Die Datei kann einen abschließenden Zeilenumbruch haben. Vorteile gegenüber JSON-Arrays: Streaming-freundlich (eine Zeile nach der anderen lesen, ohne die gesamte Datei zu laden), einfach anfügen, einfach zu grep, speichereffizient für große Datensätze. Verwendet von: Elasticsearch Bulk API, OpenAI Fine-Tuning-Datensätze, Log-Aggregation, Clickhouse, BigQuery.

Wie unterscheidet sich JSONL von einem JSON-Array?▾

JSON-Array: [{...}, {...}, {...}] — muss die gesamte Datei lesen, bevor geparst wird, gut für kleine Datensätze. JSONL: ein Objekt pro Zeile, streambar Zeile für Zeile. Die Konvertierung ist einfach: JSONL → JSON-Array: Linien in [] einpacken und mit Kommas verbinden. JSON-Array → JSONL: jedes Element auf einer eigenen Zeile stringifizieren. Praktischer Unterschied: Eine 10 GB JSON-Array benötigt 10 GB RAM zum Parsen; eine 10 GB JSONL-Datei benötigt nur genug RAM, um einen Datensatz zu speichern. Tools: jq, jsonlines Python-Bibliothek, Clickhouse, Apache Kafka unterstützen alle JSONL nativ.

Wie parse ich JSONL in JavaScript?▾

Zeile für Zeile: const records = text.split("\n").filter(line => line.trim()).map(line => JSON.parse(line)). Stream-Verarbeitung: Verwenden Sie fs.createReadStream() mit readline-Schnittstelle in Node.js. readline.createInterface({ input: fileStream }).on("line", (line) => { if (line.trim()) process(JSON.parse(line)); }). Für große Dateien verwenden Sie den Streaming-Ansatz — laden Sie die gesamte Datei niemals in den Speicher. Browser: Datei abrufen und einen TransformStream mit Zeilenaufteilung verwenden. Fehlerbehandlung: umhüllen Sie jeden JSON.parse() in try-catch, um malformed Lines zu behandeln.

Was ist das OpenAI Fine-Tuning JSONL-Format?▾

OpenAI Fine-Tuning verwendet JSONL mit einem bestimmten Schema. Chat-Format: jede Zeile ist {"messages": [{"role": "system", "content": "..."}, {"role": "user", "content": "..."}, {"role": "assistant", "content": "..."}]}. Completion-Format (Legacy): jede Zeile ist {"prompt": "...", "completion": " ..."}. Anforderungen: mindestens 10 Beispiele, empfohlen 50-100+. Dateigröße: max 1 GB. Validierung: verwenden Sie den openai tools.fine_tunes.prepare_data-Befehl. Das "\n"-Token nach dem Completion ist wichtig, damit das Modell lernt, wo Antworten enden.

Wie arbeite ich mit großen JSONL-Dateien?▾

Befehlszeile: Linien zählen: wc -l file.jsonl. Erste 10 abrufen: head -n 10 file.jsonl. Letzte 10 abrufen: tail -n 10 file.jsonl. Mit jq filtern: cat file.jsonl | jq -c 'select(.status == "active")'. Python-Streaming: with open("file.jsonl") as f: for line in f: record = json.loads(line). Nach Zeilenanzahl teilen: split -l 1000 file.jsonl chunk_. Zusammenführen: cat chunk_* > merged.jsonl. Sortieren: sort -t'"status"' file.jsonl (Zeilen sortieren, seien Sie vorsichtig). DuckDB: SELECT * FROM read_json_auto('file.jsonl', format='newline_delimited').

Bild-Tools