JSONL / JSON Lines-Formatierer

Validieren und formatieren Sie JSONL (JSON Lines / NDJSON) Dateien, bei denen jede Zeile ein JSON-Objekt ist. Nützlich für Machine-Learning-Datensätze, Protokolldateien und Streaming-Daten.

4 valid records

Table View

#idnameroleactive
11Alicedevelopertrue
22Bobdesignertrue
33Carolmanagerfalse
44Davedevelopertrue

So verwenden Sie JSONL / JSON Lines-Formatierer

  1. 1Fügen Sie Ihren JSONL-Inhalt ein (ein JSON-Objekt pro Zeile).
  2. 2Zeigen Sie Validierungsergebnisse für jede Zeile mit Fehlerhervorhebung an.
  3. 3Konvertieren Sie zwischen JSONL und JSON-Array-Format, oder komprimieren/Pretty-Print jeden Datensatz.
ZenovayAnalytics

Sehen Sie, wer gerade auf Ihrer Seite ist.

  • Besucher-Tracking in Echtzeit
  • Datenschutz zuerst, kein Cookie-Banner
  • In zwei Minuten eingerichtet
Zenovay entdecken

Häufig gestellte Fragen

Was ist JSONL (JSON Lines)?
JSONL (JSON Lines) ist ein Textformat, bei dem jede Zeile ein gültiger JSON-Wert ist (normalerweise ein Objekt). Auch bekannt als NDJSON (Newline Delimited JSON) oder JSON Lines. Regeln: jede Zeile ist ein vollständiges, gültiges JSON-Objekt. Linien werden durch Zeilenumbrüche (\n) getrennt. Kein nachfolgendes Komma zwischen Linien. Die Datei kann einen abschließenden Zeilenumbruch haben. Vorteile gegenüber JSON-Arrays: Streaming-freundlich (eine Zeile nach der anderen lesen, ohne die gesamte Datei zu laden), einfach anfügen, einfach zu grep, speichereffizient für große Datensätze. Verwendet von: Elasticsearch Bulk API, OpenAI Fine-Tuning-Datensätze, Log-Aggregation, Clickhouse, BigQuery.
Wie unterscheidet sich JSONL von einem JSON-Array?
JSON-Array: [{...}, {...}, {...}] — muss die gesamte Datei lesen, bevor geparst wird, gut für kleine Datensätze. JSONL: ein Objekt pro Zeile, streambar Zeile für Zeile. Die Konvertierung ist einfach: JSONL → JSON-Array: Linien in [] einpacken und mit Kommas verbinden. JSON-Array → JSONL: jedes Element auf einer eigenen Zeile stringifizieren. Praktischer Unterschied: Eine 10 GB JSON-Array benötigt 10 GB RAM zum Parsen; eine 10 GB JSONL-Datei benötigt nur genug RAM, um einen Datensatz zu speichern. Tools: jq, jsonlines Python-Bibliothek, Clickhouse, Apache Kafka unterstützen alle JSONL nativ.
Wie parse ich JSONL in JavaScript?
Zeile für Zeile: const records = text.split("\n").filter(line => line.trim()).map(line => JSON.parse(line)). Stream-Verarbeitung: Verwenden Sie fs.createReadStream() mit readline-Schnittstelle in Node.js. readline.createInterface({ input: fileStream }).on("line", (line) => { if (line.trim()) process(JSON.parse(line)); }). Für große Dateien verwenden Sie den Streaming-Ansatz — laden Sie die gesamte Datei niemals in den Speicher. Browser: Datei abrufen und einen TransformStream mit Zeilenaufteilung verwenden. Fehlerbehandlung: umhüllen Sie jeden JSON.parse() in try-catch, um malformed Lines zu behandeln.
Was ist das OpenAI Fine-Tuning JSONL-Format?
OpenAI Fine-Tuning verwendet JSONL mit einem bestimmten Schema. Chat-Format: jede Zeile ist {"messages": [{"role": "system", "content": "..."}, {"role": "user", "content": "..."}, {"role": "assistant", "content": "..."}]}. Completion-Format (Legacy): jede Zeile ist {"prompt": "...", "completion": " ..."}. Anforderungen: mindestens 10 Beispiele, empfohlen 50-100+. Dateigröße: max 1 GB. Validierung: verwenden Sie den openai tools.fine_tunes.prepare_data-Befehl. Das "\n"-Token nach dem Completion ist wichtig, damit das Modell lernt, wo Antworten enden.
Wie arbeite ich mit großen JSONL-Dateien?
Befehlszeile: Linien zählen: wc -l file.jsonl. Erste 10 abrufen: head -n 10 file.jsonl. Letzte 10 abrufen: tail -n 10 file.jsonl. Mit jq filtern: cat file.jsonl | jq -c 'select(.status == "active")'. Python-Streaming: with open("file.jsonl") as f: for line in f: record = json.loads(line). Nach Zeilenanzahl teilen: split -l 1000 file.jsonl chunk_. Zusammenführen: cat chunk_* > merged.jsonl. Sortieren: sort -t'"status"' file.jsonl (Zeilen sortieren, seien Sie vorsichtig). DuckDB: SELECT * FROM read_json_auto('file.jsonl', format='newline_delimited').