Duplikat-Zeilen-Entferner

Entfernen Sie doppelte Zeilen aus Text. Optionen für Groß-/Kleinschreibung, Whitespace-Trimmen, Reihenfolgenerhaltung und Anzeige der Anzahl entfernter Zeilen.

So verwenden Sie Duplikat-Zeilen-Entferner

  1. 1Fügen Sie Ihren Text mit doppelten Zeilen ein oder geben Sie ihn ein.
  2. 2Wählen Sie Optionen für Groß-/Kleinschreibung und Whitespace-Trimmen.
  3. 3Zeigen Sie die deduplizierten Ausgaben mit der Anzahl der entfernten Zeilen an.
  4. 4Kopieren Sie die eindeutigen Zeilen oder laden Sie Textdatei herunter.
ZenovayAnalytics

Analytics, für Gründer gebaut.

  • Besucher-Tracking in Echtzeit
  • Datenschutz zuerst, kein Cookie-Banner
  • In zwei Minuten eingerichtet
Zenovay entdecken

Häufig gestellte Fragen

Was gilt als doppelte Zeile?
Standardmäßig sind zwei Zeilen doppelt, wenn sie Zeichen für Zeichen identisch sind (Groß-/Kleinschreibung beachtet). Im Modus ohne Groß-/Kleinschreibungsunterscheidung sind "Apfel" und "apfel" Duplikate. Mit Leerraum-Trimmen sind " hallo " und "hallo" Duplikate. Das erste Auftreten jeder eindeutigen Zeile wird beibehalten; alle nachfolgenden werden entfernt.
Wie entfernt man doppelte Zeilen unter Linux oder Mac?
Mit Unix-Tools: "sort -u datei.txt" sortiert und entfernt Duplikate. "awk '!seen[$0]++'" entfernt Duplikate unter Beibehaltung der ursprünglichen Reihenfolge. "uniq datei.txt" entfernt aufeinanderfolgende Duplikate (erfordert Vorsortierung). In Python: "lines = open('f.txt').readlines(); unique = list(dict.fromkeys(lines))".
Wann sollte ich die Einfügereihenfolge beibehalten statt zu sortieren?
Behalten Sie die Reihenfolge bei, wenn die Zeilenposition wichtig ist: Log-Einträge, SQL-Ergebnisse, Konfigurationsdateien, Daten mit impliziter Reihenfolge. Sortieren Sie, wenn die Reihenfolge keine Rolle spielt: Wörterlisten, Tag-Listen, CSV-Spaltenwerte, Import-Anweisungen. Dieses Tool behält standardmäßig die Einfügereihenfolge bei.
Was ist der Unterschied zwischen "unique" und "distinct"?
Im allgemeinen Sprachgebrauch sind diese Begriffe synonym. In der Datenbankterminologie: DISTINCT entfernt doppelte Zeilen aus Abfrageergebnissen; UNIQUE ist eine Einschränkung, die das Einfügen von Duplikaten verhindert. SQL: SELECT DISTINCT spalte FROM tabelle gibt jeden Wert einmal zurück, unabhängig davon, wie oft er vorkommt.
Können sehr grosse Dateien verarbeitet werden?
Dieses Browser-basierte Tool verarbeitet in das Eingabefeld eingefügten Text. Für sehr grosse Dateien (Millionen von Zeilen) verwenden Sie stattdessen Kommandozeilentools: awk '!seen[$0]++' eingabe.txt > ausgabe.txt. Das Browser-Tool ist für bis zu ~50.000 Zeilen geeignet.