HANDEDICT汉德词典
HanDeDict 汉德词典
Suche Änderungen Infos Suchtipps Details Über Download Benutzerliste
DE EN
 

Format und redaktionelle Richtlinien

Diese Website bietet Funktionen, um HanDeDict zu durchsuchen, zu bearbeiten, und den Änderungsverlauf durchzusehen. Das Wörterbuch selbst ist eine große Textdatei, die Einträge im CC-CEDICT-Format enthält, ergänzt durch Metainformationen für jeden Eintrag, inklusive einer eindeutigen Kennung und der vollständigen Änderungsgeschichte des Eintrags. Technisch werden diese Informationen in einer Datenbank gespeichert. Die Website generiert jedoch jede Nacht eine aktualisierte Version der Textdatei.

Wenn Sie HanDeDict über die Website durchsuchen oder bearbeiten, bekommen Sie das textbasierte Format nie direkt zu sehen. Viele Entscheidungen, die den Aufbau und Inhalt des Wörterbuchs betreffen, folgen jedoch direkt aus den Beschränkungen des Formats. Diese Seite gibt einen Überblick über (1) das zugrunde liegende CC-CEDICT-Format; (2) die Erweiterungen, die das Speichern der Änderungsgeschichte ermöglichen; und (3) die redaktionellen Richtlinien und Konventionen, die über das Format hinaus die Gestaltung des Wörterbuchs bestimmen.

Anatomie eines CC-CEDICT-Eintrags

Mit Ausnahme von Kommentaren, die mit einem #-Zeichen gekennzeichnet sind, steht jede nicht leere Zeile in der Datei für einen einzigen Wörterbucheintrag. Diese Zeilen haben die folgende interne Struktur:

檢索 检索 [jian3 suo3] /Recherche, Suche (S)/recherchieren, suchen (V)/
  • Dies ist eine Zeile aus einer einfachen Textdatei; die Farben sind nur zur Verdeutlichung hinzugefügt worden.
  • Die Zeile beginnt mit dem Schlagwort, das wiederum aus der traditionellen Variante, der vereinfachten Variante und der Pinyin-Umschrift in eckigen Klammern besteht. Diese drei Teile sind durch Leerzeichen getrennt.
  • Der Ton wird für Pinyin-Silben mit einer Ziffer zwischen 1 und 4 angegeben; 5 steht für den neutralen Ton. Pinyin-Silben werden durch Leerzeichen getrennt.
  • Der Rest der Zeile gibt die deutschen Bedeutungen an, die durch Schrägstriche getrennt und eingerahmt werden.
  • Als eine logische Einschränkung muss jedes Schlagwort die gleiche Anzahl an traditionellen und vereinfachten Schriftzeichen und Pinyin-Silben haben.
  • Durch 儿 retroflex artikulierte Vokale werden in der Pinyin-Umschrift mit einer alleinstehenden Silbe r5 angegeben - d.h., sie werden nicht mit der vorausgegangenen Silbe als z.B. wanr2 zusammengeschrieben.

Wenn er als Suchergebnis angezeigt wird, sieht derselbe Eintrag wie folgt aus:

jiǎn suǒ
1 Recherche, Suche (S)2 recherchieren, suchen (V)

 

Erweitertes Format

Neben den „normalen“ Zeilen, die keine Kommentare sind und die aktuelle Form jedes Eintrags repräsentieren, enthält die neue HanDeDict-Datei noch weitere Informationen in kommentierten Zeilen. In seiner ursprünglichen Version auf HanDeDict @ Zydeo sieht der obige Eintrag so aus:

# ID-a54wi5I
# Ver 2011-05-28T01:27:49Z HanDeDict Stat-New 001>Originalversion HanDeDict-Datei
# 檢索 检索 [jian3 suo3] /Recherche, Suche (u.E.) (S)/recherchieren, suchen (u.E.) (V)/
# Ver 2016-10-23T15:32:07Z zydeo-robot Stat-New 002>Datenreinigung
檢索 检索 [jian3 suo3] /Recherche, Suche (S)/recherchieren, suchen (V)/

Erweiterte Einträge werden in der Textdatei durch Leerzeilen getrennt; jeder Abschnitt beginnt mit einer kommentierten Zeile, die die eindeutige Eintragskennung enthält. Jede Änderung in der Versionsgeschichte des Eintrags wird mit ein oder zwei Zeilen repräsentiert.

  • Die erste Zeile, die immer vorhanden ist, beginnt mit Ver und enthält folgende Angaben: den Zeitpunkt der Änderung; den Benutzer, der die Änderung eingetragen hat; den Status des Eintrags nach der Änderung; und schließlich, nach dem Zeichen >, den Kommentar zur Änderung.
  • Wenn durch die Änderung das Schlagwort oder die deutschen Bedeutungen geändert worden sind, folgt eine zweite Zeile mit dem Inhalt des Eintrags nach der Änderung.
  • Jeder Eintrag hat einen der folgenden Status: Neu (Stat-New), Verifiziert (Stat-Verif) oder Markiert (Stat-Flagged).
  • Es gibt Änderungen, die eine große Anzahl Einträge betreffen (z.B. automatische Datenreinigung durch Skripts, oder der Import von Einträgen aus einer externen Datei). Um zu vermeiden, dass die Änderungsgeschichte in solchen Fällen von tausenden zusammenhängender Änderungen überflutet wird, werden Änderungen dieser Art als eine einzige Massenänderung angezeigt. Massenänderungen werden implizit durch die dreistellige Nummer vor dem >-Zeichen definiert, das den Kommentar einleitet. Die Website hat eine spezielle Seite für jede Massenänderung. Diese Seite stellt weitere Informationen über die Änderung bereit, und verlinkt, wo möglich, auf die relevanten Input- und Output-Dateien sowie auf das verwendete Skript. Gewöhnliche, einzeln eingetragene Änderungen sind daran zu erkennen, dass keine dreistellige Nummer vor dem >-Zeichen steht.

Status der Einträge in der HanDeDict-Originaldatei: Die Mehrzahl der Einträge in der letzten Version der HanDeDict-Datei aus 2011 ist unverifiziert. Dies wurde durch die Abkürzung (u.E.) im Eintragstext selbst angezeigt. Unverifizierte Einträge haben in HanDeDict @ Zydeo am Anfang den Status "Neu". Die wenigen verifizierten Einträge haben den Status "Verifiziert" erhalten.

Konventionen und redaktionelle Richtlinien

Tonsandhi wird in den Schlagwörtern nicht angegeben. Insbesondere 一 und 不 haben immer den ersten und vierten Ton, auch wenn sie im gegebenen Kontext anders ausgesprochen werden. Im gleichen Sinne wird die Änderung vom 3. zum 2. Ton vor einem 3. Ton nicht angegeben. So behält z.B. in 你好 nǐ hǎo die erste Silbe den 3. Ton. Dies entspricht der Vorgehensweise praktisch aller chinesischen Wörterbücher.

Lexikalisierte Änderungen zum neutralen Ton werden hingegen explizit angezeigt. So lautet die Pinyin-Umschrift von 明白 míng bai und nicht míng bái.

Klammern weisen immer auf Metainformationen hin: was in Klammern steht, ist also nicht als deutsche Entsprechung des chinesischen Schlagworts zu verstehen.

  • Text, der in Klammern steht, kann nicht über die Suchfunktion gefunden werden. Dies ist das Wichtigste, woran Sie beim Bearbeiten des Wörterbuchs denken sollten: Klammern haben grundsätzlich die Funktion, den eingeklammerten Text aus der Suche auszuschließen.
  • Um anzudeuten, dass der Text in Klammern nicht direkt als Übersetzung zu verstehen ist, wird er in den Suchergebnissen in Kursivschrift wiedergegeben.
  • Text in Klammern darf nur am Anfang und am Ende von Bedeutungen stehen, nicht in der Mitte.
  • Vermeiden Sie insbesondere Konstruktionen wie die folgende: Befragte(r), Interviewte(r). Text, der so formuliert ist, kann nicht korrekt indiziert werden, was dazu führt, dass die Suchfunktion relevante Einträge nicht findet. Es gibt noch viele solche Beispiele im Wörterbuch. Ein wichtiges Ziel beim Bearbeiten besteht darin, diese zu korrigieren.
  • Die überlieferte HanDeDict-Datei gibt die Wortart in Klammern an, wobei es unklar ist, woher diese Informationen stammen und genau was sie bedeuten. (Beziehen sie sich auf das Schlagwort oder auf die deutsche Entsprechung? Durch genau welche automatische Methode sind sie generiert worden, und wie verlässlich sind sie?) Trotz dieser Zweifel bleiben die ursprünglichen Wortart-Angaben erhalten. Beim Bearbeiten von Einträgen wird jedoch nicht erwartet, dass Sie die alten Wortart-Angaben beibehalten müssen, und in neuen Einträgen sind sie auch nicht erforderlich.
  • Die überlieferte HanDeDict-Datei enthält eine große Anzahl von Bezeichnungen für Domäne, Stilebene usw. Es liegen jedoch keine Richtlinien oder Konventionen vor, die erklären, wie die Bezeichnungen verwendet wurden. Vorerst gibt es auch auf HanDeDict @ Zydeo keine redaktionellen Richtlinien für die Verwendung von Bezeichnungen.
  • Wo es nicht möglich ist, eine deutsche Entsprechung zu finden, können Sie die gesamte Paraphrase oder Erklärung in Klammern eintragen. Dies ist besonders nützlich bei Funktionswörtern, die keine "Übersetzung" in einer anderen Sprache haben - man denke z.B. an Partikel wie 的.

Was ist ein Wort? HanDeDict enthält viele Einträge, die genau genommen keine Wörter sind, u.a. Chengyu (Sprichwörter), Eigennamen, feste Ausdrücke oder einfach häufige Kollokationen. Bei der Bearbeitung von HanDeDict kommt es nicht darauf an, ob etwas ein Wort ist oder nicht. Wenn Sie der Meinung sind, dass etwas eigenständig ist und für jemanden hilfreich sein könnte, der versucht, einen chinesischen Text zu verstehen, so gehört es als Eintrag in HanDeDict. Folgendes sollte jedoch nicht ins Wörterbuch eingetragen werden:

  • Ausdrücke, deren Bedeutung aus den Teilen vollständig und transparent abgeleitet werden kann. Triviale Wortverbindungen oder Sätze.
  • Durchsichtig modifizierte Wörter. 蓝色 lán sè steht für die blaue Farbe; es ist unnötig, 蓝色的 lán sè de ins Wörterbuch einzutragen, als ob es ein eigenständiges Adjektiv wäre.

Pinyin-Wörter. In HanDeDict dient Pinyin ausschließlich dem Zweck, die Aussprache der einzelnen Silben im Schlagwort anzudeuten. Wortgrenzen werden also nicht eingehalten: alle Silben sind mit Leerzeichen getrennt. Hauptgrund dafür ist, dass die überlieferte HanDeDict-Datei keine Informationen über Wortgrenzen enthält. Da das Wörterbuch nicht nur Wörter, sondern auch sehr viele längere Ausdrücke enthält, wäre es eine riesige Aufgabe, Wortgrenzen händisch einzutragen, wobei der Wert für die Benutzer des Wörterbuchs relativ gering wäre.

Orthographische und phonetische Varianten. Manche Schlagwörter haben alternative Schreibweisen mit unterschiedlichen Schriftzeichen, überwiegend was die traditionellen Schriftzeichen betrifft. In anderen Fällen gibt es alternative Aussprachen (hauptsächlich Tonschwankungen, die häufig mit regionaler Variation zusammenhängen). Das aktuelle Format von HanDeDict kann diese Informationen nicht elegant erfassen. Die einzige Möglichkeit ist, für jede Variante einen neuen Eintrag zu erstellen. Dieses Problem wird in der Zukunft möglicherweise durch eine Erweiterung des Formats gelöst.

Deutsche Rechtschreibung. Bevorzugt wird die neue Rechtschreibung, wie sie in Deutschland verwendet wird. Sie ist jedoch nicht obligatorisch. Die Suchfunktion berücksichtigt die wichtigsten Unterschiede, damit beim Durchsuchen unabhängig von der Schreibweise alle relevanten Wörter gefunden werden.

Bedeutungen und Alternativen. HanDeDict hat keine strengen Vorschriften, wie verschiedene Bedeutungen des Schlagworts in den Einträgen zu unterscheiden sind. Alternativen für dieselbe Bedeutung werden häufig innerhalb der Bedeutung aufgezählt, getrennt entweder durch Kommas oder Strichpunkte. In anderen Einträgen erscheinen alternative Übersetzungen als verschiedene Bedeutungen. Beide Methoden sind akzeptabel. In vielen Fällen ist schwer zu entscheiden, wo die Grenze zwischen unterschiedlichen Bedeutungen und Synonymen für dieselbe Bedeutung liegt.

Wenn Sie einen Eintrag bearbeiten, denken Sie an den Benutzer des Wörterbuchs, und versuchen Sie, eine Formulierung zu finden, die es dem Benutzer erleichtert, die Bedeutungen, das sprachliche Register und die Verwendung des chinesischen Wortes zu erfassen.

OK Mehr erfahren
Diese Website verwendet für einige Funktionen Cookies. Indem Sie die Website benutzen, stimmen Sie der Verwendung von Cookies zu.
mmmmmmmmmm