Die wichtigsten Arten von maschinellen Übersetzungsfehlern. Als wissenschaftliche Disziplin.

  • DE-1. Grundlagen der Struktur und Eigenschaften von Materialien. Phasentransformationen.
  • De-2.Vow-Wärmebehandlung und Oberflächenhärtung von Legierungen
  • Vortrag 13. Maschinenübersetzung von Text. Computer sprachliche Wörterbücher

    Grundlagen der maschinellen Übersetzung

    Transfer- Dies ist eine Art Sprachmediation, das auf ein ungültiges Original fokussiert ist. Die Übersetzung gilt als Eingabeformular der Existenz einer im Original enthaltenen Nachricht. Die mit der Übertragung durchgeführte Zwischenkommunikation in größtem Maße reproduziert den Prozess der direkten Sprachkommunikation, in der die Kommunikationsmittel dieselbe Sprache verwenden.

    Maschine übersetzen - Dies ist eine automatische Extraktion von Wissen und Texten, die in einer natürlichen Sprache mit Computerprogrammen auf der Grundlage der sprachlichen Bestimmung verfasst sind.

    Machine-Übersetzungsprozess. - Dies sind die Aktionen des Computers, um Text in eine natürliche Sprache in den entsprechenden Text in eine andere Sprache sowie das Ergebnis solcher Aktionen zu konvertieren.

    Automatisches TextverständnissystemEs stammt von der Tatsache, dass der Text in der natürlichen Sprache, der gemäß den Wörterbüchern, der Grammatik, der Algorithmen der natürlichen Sprache, basierend auf dem semantischen Netzwerk, der Frames und des Thesaurus gebaut wurde, vom Benutzer aufgrund der Tatsache verstanden wird, dass Er hat sprachliches Wissen - syntaktisch-semantische Strukturen sowie besonderes Wissen.

    Die meisten der automatischen Sprachverarbeitungssysteme setzen ihre Aufgabe, Texte zu analysieren, in Vorschläge zu unterbrechen. Sprachdaten stehen uns jedoch am häufigsten in Form von Texten zur Verfügung, die auf Absätzen, Kapiteln und anderen größeren Einheiten platziert sind. Daher sind geeignete Segmentierungsalgorithmen für ihre effektive automatische Analyse erforderlich.

    Aufgaben beim Erstellen eines Systems des automatischen Textverständnisses:

    · Analyse des natürlichen Textes der Quelle, der den Aufbau von sprachlichen Strukturen gewährleistet, einschließlich verschiedener semantischer Strukturen, voll, teilweise, komprimiert, scheinbar dem Inhalt des Textes in Form von Datenbanken dargestellt,

    · Vergleich der sprachlichen Textstrukturen mit speziellen oder individuellen Wissen, auch im Datenbankformular dargestellt

    · Verallgemeinerung von Texten basierend auf Informationen, die in traditionellen relationalen Datenbanken abgeschlossen wurden, sowie in konzeptionellen Textstrukturen oder in einzelnen Datenbanken.

    Zum maschinentransfers. Der Computer führt eine spezielle Programmimplementierung ein Übersetzungsalgorithmus, Unter dem, unter dem die Reihenfolge definitiv verstanden wird, und streng definierte Aktionen auf dem Text, um Übersetzungen in einem bestimmten Paar Sprachpaar in einer bestimmten Richtungsrichtung zu finden (von einer bestimmten Sprache zur anderen). Es gibt auch separate maschinelle Übersetzungssysteme für die Übersetzung in drei oder mehr Sprachen, aber sie sind derzeit experimentell.

    Moderne Maschine oder automatische Übersetzung mit einer Person: Pre-Editor, die auf die eine oder andere Weise den Text, den Inter-Editor, der an dem Übersetzungsprozess beteiligt ist, oder den Post-Editor, der Fehler und Mängel in der Übersetzter Text.

    Das maschinelle Übersetzungssystem umfasst zweisprachige Wörterbücher, die mit den erforderlichen grammatikalischen Informationen (morphologisch, syntaktisch und semantisch) ausgestattet sind, die die Übertragung von gleichwertiger, Varianten- und Transformationsumwandlung, vernünftigen und speziellen thematischen Wörterbüchern sowie algorithmische Mittel der grammatikalischen Analyse sicherstellen, die alle implementieren angenommen für die automatische Bearbeitung der formalen Textformatikrammatik.

    Das häufigste ist der folgende reihenfolge der formalen Operationen Bereitstellung von Analysen und Synthese im Maschinenübersetzungssystem:

    · Geben Sie Text und die Suche nach Eingabeformularen in das Eingabewörterbuch mit einer gleichzeitigen morphologischen Analyse ein, in der die Zugehörigkeit dieser Wortform an einem bestimmten Lexeme eingerichtet ist. Bei der Analyseprozesse können auch Informationen, die sich auf andere Organisationsebenen des Sprachsystems beziehen, auch aus dem Wortformular erhalten werden.

    · Übersetzung idiomatischer Phrasen, phrineologische Einheit oder Briefmarken dieses Themenbereichs, Bestimmung der wichtigsten grammatikalischen Eigenschaften von Elementen des Eingabetextes, der Auflösung von Omographie, lexikalischer Analyse und Translation des Lexings. Normalerweise werden in dieser Phase eindeutige Wörter von mehreren von mehreren getrennt, danach werden eindeutige Wörter durch die Listen der Äquivalenten übersetzt, und sogenannte kontextologische Wörterbücher werden die Vokabular-Artikel verwendet, um mehrwertige Wörter zu übersetzen, die die Kontextanforderungsalgorithmen für die Anwesenheit / Fehlen kontextabhängiger Determinanten.

    · Ultimative Grammatikanalyse, in der die erforderlichen Grammatiksinformationen unter Berücksichtigung der Ausgabedaten dargestellt werden.

    · Synthese von Ausgaberwordforms und -vorschlägen im Allgemeinen am Wochenende.

    Analyse und Synthese können sowohl mächtige als auch für den gesamten Text durchgeführt werden, der in den Speicher des Computers eingeführt wird; Im letzteren Fall sieht der Übersetzungsalgorithmus für die Definition der sogenannten anaphorischen Krawatten vor.

    Maschinelle Übersetzungsqualität. hängt von der:

    · Volumen von Wörterbüchern,

    · Datenvolumen, die lexikalische Einheiten zugeschrieben werden,

    · Gründlichkeit der Vorbereitung und Überprüfung des Betriebs von Analyse- und Synthesealgorithmen,

    · Software-Effizienz.

    Weder aus einem der Programme können jedoch nicht erwartet "richtig", die literarische Übersetzung des Textes, bestehend aus komplexen Phrasen.

    Moderne Hardware und Software nutzt große Quennierungen, die detaillierte grammatische Informationen enthalten. Informationen können als in dargestellt werden delarativistisch(beschreibend) und in prozedural.(Berücksichtigung der Anforderungen des Algorithmus).

    Verbesserung der Maschinenübersetzungsprogramme Es hängt mit dem Konzept eines weichen Verständnisses des Textes zusammen, nach dem verschiedene Benutzer ihre Informationen und ihre individuelle Bedeutung aus demselben Text abholen. Modell des weichen Textverständnisses Es ist die Fähigkeit, verschiedene sinnvolle Interpretationen des Quellobjekts, abhängig von den unterschiedlichen Bedingungen und den Komponenten seiner Wahrnehmung zu erstellen.

    Weitere private "Werkzeugmaschinen" Um dem Übersetzer und dem Herausgeber zu helfen, sind Automatik-Wörterbücher und terminologische Datenbanken, Computer-Thesaurus, Bildschirmbearbeitung, orphographische, terminologische und grammatische Korrektursysteme.

    Die moderne maschinelle Übersetzung sollte von der Verwendung von Computern unterschieden werden, um einem Person-Übersetzer zu helfen. Im letzteren Fall bedeuten automatisches Wörterbuchund helfen der Person schneller, das gewünschte Übersetzungsäquivalent zu wählen. Obwohl im anderen Fall der Computer mit einer Person (Übersetzer oder Herausgeber) arbeitet, beinhaltet die Wartung des Begriffs "maschinelle Übersetzung" die Idee, dass der Hauptangebot, die meisten Arbeiten an der Übersetzung und der Suche nach Übersetzungsäquivalenten und übertragbarer Maschine dauert Selbst, und ließ eine Person nur Steuerung und Fehlerkorrektur.

    Computerwörterbuch. Um einer Person zu helfen, ist das Hilfsmittel für die schnelle Umwandlung; Gleichzeitig können einige Funktionen, die in maschinellen Übersetzungssystemen inhärent sind, in solchen Wörterbüchern in einem begrenzten Abschluss implementiert werden.

    In der Informationstechnologie variieren 2 Hauptansätze für die maschinelle Übersetzung:

    · Oberflächenbekenntnis mit dem Inhalt des Dokuments in einer unbekannten Sprache.

    · Verwendung von Maschinenübersetzung anstelle des üblichen "Human". Dies beinhaltet eine sorgfältige Bearbeitung und Konfiguration des Translationssystems in einen bestimmten Fachbereich.

    Hier wird die Rolle der Fülle des Wörterbuchs gespielt, die Orientierung davon für den Inhalt und eine Reihe von Sprachmitteln übersetzte Texte, die Wirksamkeit der Methoden zur Lösung von lexikalischer Bedeutung, der Wirksamkeit der Arbeit von Algorithmen für die Extraktion von Grammatikalitäten, Finden von Übersetzungen und Synthesealgorithmen.

    Als Art von Sprachaktivität Die Übersetzung betrifft alle Sprachniveaus - von der Anerkennung des Graphems (und dem Hintergrund beim Übersetzen der oralen Sprache) vor der Übertragung der Bedeutung der Anweisung und des Textes. Darüber hinaus bietet die maschinelle Übersetzung die Möglichkeit, theoretische Hypothesen um das Gerät für bestimmte Sprachniveaus und die Wirksamkeit der angebotenen Algorithmen zu überprüfen.

    Die Notwendigkeit der Verbesserung Die maschinelle Übersetzung steigt ständig, da es sich um eine wesentliche Bedingung für die Gewährleistung der interlentischen Kommunikation handelt, deren Höhe jedes Jahr steigt.

    Andere Möglichkeiten, Sprachbarrieren für die Kommunikation zu überwinden - die Entwicklung oder Annahme einer einzelnen Sprache sowie das Studium der Fremdsprachen - können nicht mit der Umwandlung von Effizienz verglichen werden.

    Geburtsdatum Maschinenübersetzung als Forschungsfeld wird in der Regel als März 1947 angesehen. Dann war dieser Spezialist für Kryptographie Warren Water in seinem Brief an Nubert Winer zuerst die Aufgabe der Machine-Übersetzung, indem er es mit der Aufgabe der Entschlüsselung verglichen hatte.

    Maschinenübersetzungsprobleme tun computerlinguistikWer wurde im Januar 1954 geboren, als das weltweit erste öffentliche Übertragungsversuch in der Georgetown University (USA) stattfand. Gleichzeitig begann Alexey Lyapunov unter der Führung der größten Mathematik und Cybernetics mit der aktiven Arbeit an der maschinellen Übersetzung und in Moskau. Anfang 1956 am Institut für Angewandte Mathematik (IPM) begann das erste inländische Machine-Übersetzungssystem von Französisch in Russisch am Institut für angewandte Mathematik.

    Führer unter modernen maschinellen Übersetzungsprogrammen in Russland - PROMT-System (Unternehmensentwicklungsplatz, www.e-promt.ru) und Sokrates-System (Entwicklung von Arsenal, www.ars.ru).

    In der neuesten Version von PROMT erscheint eine grundsätzlich neue Funktionalität, "zugeordnete Speicher". Mit dem Mechanismus des "zugeordneten Speichers" können Sie das System trainieren. Damit können Sie die Kollektion von Text in der Wissensdatenbank speichern und die Fragmente beim Übersetzen ähnlicher Texte weiter verwenden.

    Sokrates versucht, eine eindeutige Lösung zu finden und gibt keine Abweichungen in Bezug auf: Das in dem Wörterbuch fehlende Wort bleibt im Originalschreiben. PROMT bietet in der Regel mehrere Möglichkeiten für die Übersetzung von Wörtern und Phrasen.

    Die maschinelle Übersetzung, die mehrere Stadien seiner Entwicklung bestanden hat, konzentriert sich derzeit auf die Idee, eine Person-Übersetzer-Aktionen zu modellieren. Der Übersetzungsprozess ist sehr schwierig, und die korrekte Verwendung der Softwarevorteile bestimmt weitgehend die Qualität der Übersetzung. Zu den modernen Machine-Übersetzungssystemen zählen viele zusätzliche Wörterbücher. Basierend auf den Merkmalen architektonischer Lösungen für sprachliche Algorithmen sind Systeme in zwei Arten unterteilt - "Transfer" und "Interlingua". Automatische Übersetzungsprogramme werden gemäß dieser Division erstellt. So übersetzt das Programm "SOCRATES" also viel besser als "Madzhik Guddi", da die sprachliche Erbringung des ersten Programms viel stärker ist, und Wörterbücher sind viel mehr in den Volumen.

    Die Ergebnisse der Maschine werden immer bearbeitet. Beispielsweise wird im Pars-Programm eine zusätzliche Verbindung von Wörterbüchern verschiedener Fächer bereitgestellt. Immerhin hängt die Qualität der übertragenen Transformationsmaschine von der Qualität des Programms ab. Aber selbst die Feinabstimmung des Systems unter dem Vokabular des übersetzten Textes berücksichtigt nicht alle seine Funktionen, sodass Wörter mit mehreren Synonymen mit einem Sternchen gekennzeichnet sind oder in Klammern als Option gegeben werden.

    Internet-Technologien Gab eine neue Entwicklung mit der maschinellen Übersetzung, um es in eine neue Entwicklungsphase zu bringen. Machine-Übersetzung ist ein effektives Werkzeug zum Anzeigen und Suchen nach Informationen in einer Fremdsprache, nämlich ist diese Funktion die Hauptsache, wenn Sie im Internet arbeiten. Mit dem aktuellen Status der Machine-Übersetzung können Sie einen relativ korrekten Text der Übersetzung von Webseiten von den meisten Sprachen erhalten. Und obwohl die vollautomatische qualitativ hochwertige Übersetzung nicht möglich ist, gibt es bereits eine Software, die den Übersetzungsprozess selbst erleichtert.

    Infolgedessen können die Einstellungen für den Fachbereich und die Integration anderer Dokumentenverarbeitungsprogramme die Maschinenübersetzung mit dem Erhalt des Übersetzungstextes automatisieren.

    Das Hauptproblem Alle Maschinenübersetzungsprogramme sind die richtige Wahl des thematischen Wörterbuchs sowie den Bau von Hilfswörterbüchern.

    Die Übersetzung hängt teilweise vom Niveau der Benutzervorbereitung (Kenntnis der Sprachkenntnissen, der Arbeitsfähigkeit mit Programmen, Sprachgefühl) ab, sowie in größerem Umfang seine Fähigkeit, ordnungsgemäß mit einem Texteditor, Hilfsmittel, Wörterbüchern, ordnungsgemäß zu arbeiten, und phrineologische Verzeichnisse. Übersetzungsoptionen, die mit Anschluss von thematischen Wörterbüchern hergestellt werden, gibt eine gute Übersetzung, die korrekte Wahl des Wortwerts und die Verwendung von Phrasen im Text. Dies wird durch die Tatsache erklärt, dass das Auto ein eigenes Wörterbuch richtet, um aus diesen Synonymen zu wählen, die einem größeren Grad an eingehender Sprache entsprechen und in Übersetzung mit dem Subjekt der Ausgabe übersetzt werden.

    2 Ansätze an das Problem der maschinellen Übersetzung:

    · Installation bei der Verwendung einer universellen Sinnsprache, direkter Übersetzungsansatz, um den Text des Originals in den Übersetzungstext umzuwandeln

    · Installation für Zwischensprache, menschliche Leistungsmodellierung

    Das Problem ist, dass die Bedeutung des Textes in der natürlichen Sprache nicht nur von dem Vorschlag selbst abhängt, sondern auch im Kontext, der mit den Multi-Wörtern und syntaktischen Strukturen verbunden ist, die praktische Unmöglichkeit der globalen Beschreibung der semantischen Struktur von Die Welt, auch in einem begrenzten Themenbereich, das Fehlen wirksamer formaler Methodenbeschreibungen von sprachlichen Mustern.

    Ungelöste Probleme Machine-Übersetzung ist.

    · Lösung der Mehrdeutigkeit der formellen syntaktischen Analyse isolierter Textvorschläge

    · Überwindung der strukturellen und semantischen Unvollständigkeit des Textes (Fragmente) des Textes

    · Organisation der flexiblen Verbindung verschiedener Themenbereiche

    · Die Notwendigkeit, den Text als gesamte Ausbildung zu verstehen

    Maschinenübersetzungsprogramme werden mit wissenschaftlichen, technischen und pädagogischen Texten besser behandelt, die einem strengen Umriss des Materials inhärent sind.

    Ein gesprochener und journalistischer Stil, in dem viele spezifische Revolutionen, aber die meisten Worte werden in einem wörtlichen Sinne eingesetzt, der für die Informationsübersetzung geeignet ist, aber manuelles Bearbeiten ist jedoch erforderlich, um einen Literat-Ausgabetext zu erhalten. Die resultierende Übersetzung ist ein bestimmter einleitender Text, bei dem nur die thematische thematische Textrichtung übertragen wird.

    Die Übersetzung von Fiktion und Poesie erfüllt nicht den Anforderungen des Autos. Die Bedeutung des auf allegorischen Ausdrückens errichteten Textes ist selbst zur Bekanntmachung verzerrt und nicht verfügbar. Das Auto versteht nicht die Sinnhaftigkeit, was wiederum zu einer falschen Interpretation des übersetzten Textes führt, der sich in einen Unsinn verwandelt.

    Versuchen Sie, solche Missverständnisse durch Beobachtung zu minimieren folgende Regeln:

    · Anpassen, um thematische Wörterbücher aufzubauen

    · Überprüfen Sie den Text des Originals in der Vorspannungsphase seiner Übertragung

    · Bearbeiten Sie in den letzten Stadien der Übersetzung

    · Richtige Nutzungswörterbücher

    · Gut zu wissen von Grammatik und Vokabular sowie dem Thema Quelltext

    · Mit Vokabeln, Klischee und Word ordnungsgemäß arbeiten

    · Spiele spezielle Wörterbücher mit neuen Begriffen

    Einführung

    Maschine übersetzen - Der Prozess der Übersetzung von Texten (geschrieben und idealerweise und oral) von einer natürlichen Sprache zur anderen mit Hilfe eines speziellen Computerprogramms. Die Richtung der wissenschaftlichen Forschung, die sich auf den Bau solcher Systeme bezieht, wird ebenfalls aufgerufen.

    Anstelle von "Maschine" verwendete manchmal das Wort automatisch, das die Bedeutung nicht beeinträchtigt. Es ist jedoch nicht notwendig, die maschinelle Übersetzung mit automatisiert zu verwirren, es hat einen völlig unterschiedlichen Wert - dabei hilft einfach eine Person, Texte zu übersetzen.

    Der Gedanke, elektronische Rechenmaschinen (Computer) für die Übersetzung zu verwenden, wurde 1947 in den Vereinigten Staaten unmittelbar nach dem Aufkommen des ersten Computers in den Vereinigten Staaten ausgedrückt. Die erste öffentliche Demonstration der maschinellen Übersetzung fand 1954 statt. Trotz der Primitivität dieses Systems erhielt dieses Experiment eine weite Resonanz.

    Bis Mitte der 1960er Jahre wurden zwei russisch-englische Übersetzungssysteme zur praktischen Verwendung bereitgestellt:

    • · Kennzeichen.
    • · Gat.

    Die ALPAC-Kommission zur Bewertung solcher Systeme kam jedoch zu dem Schluss, dass diese Tätigkeit in den Vereinigten Staaten aufgrund der schlechten Qualität von maschinenübersetzten Texten unrentabel ist. Obwohl die Kommission die fortlaufende und vertiefte theoretische Entwicklungen im Allgemeinen empfahl, führten seine Schlussfolgerungen im Allgemeinen zum Wachstum des Pessimismus, ein Rückgang der Finanzierung, häufig, häufig die Bekanntmachung der Arbeit an diesem Thema abzuschließen.

    Trotzdem in einer Reihe von Ländern studierte, was zum ständigen Fortschritt der Rechenausstattung beigetragen hat. Ein besonders wesentlicher Faktor war die Entstehung von Mini- und Personalcomputern, und mit ihnen komplexeres Vokabeln konzentrierten sich Suchmaschinen auf die Arbeit mit natürlichen Sprachdaten. Wuchs und die Notwendigkeit, als solche im Hinblick auf das Wachstum der internationalen Beziehungen zu übersetzen. All dies führte zu einem neuen Anstieg in diesem Bereich. Die Zeit der breiten praktischen Nutzung von Übersetzungssystemen ist gekommen, der Markt für kommerzielle Entwicklungen dieses Themas hat sich entwickelt.

    Die hochwertige Übersetzung von Texten eines breiten Subjekts ist jedoch immer noch unerreichbar. Zweifellos ist die Beschleunigung des Übersetzers bei der Verwendung von Maschinenübersetzungssystemen.

    1. Basisteil

    Maschinenübersetzungssysteme sind in drei Kategorien unterteilt:

    • -systeme, die auf grammatikalischen Regeln basieren (Regelbasierte Machine-Übersetzung, RBMT),
    • -statistische SystemeStatistische Machine Übersetzung, SMT)
    • -hybridsystemedie Vorteile dieser und anderer (sind die vielversprechendsten)

    Maschinenübersetzung basierend auf Regeln - ein gemeinsamer Begriff, der maschinelle Übersetzungssysteme bedeutet, die auf sprachlichen Informationen über Quell- und Übersetzungssprachen basieren. Sie bestehen aus zweisprachigen Wörterbüchern und Grammatik, die die wichtigsten semantischen, morphologischen, syntaktischen Muster jeder Sprache abdecken. Dieser Ansatz zur maschinellen Übersetzung wird ebenfalls genannt klassisch. Basierend auf diesen Daten wird der Quelltext nacheinander nach Vorschlägen in den Übersetzungstext umgewandelt. Das Prinzip des Betriebs solcher Systeme ist der Anschluss der Struktur des Eingabe- und Ausgabesatzes. Computermaschine Übersetzung.

    RBMT-Systeme sind in drei Gruppen unterteilt:

    • · Systeme der sozialen Übersetzung;
    • · Transfersysteme (Transfer) - Konvertieren Sie die Eingabesprachen in die grammatikalischen Konstruktionen der Ausgangssprache;
    • · Interpretuistische Systeme (Interlingua) - Intermediate-Sprache Beschreibung Sprache.

    Der Hauptvorteil der Transferbasierten Systeme ist eine hohe Fülle der Textabdeckung, wenn die Übersetzungsqualität akzeptabel ist, sowie ein niedriges Kostengrad für Primärentwicklung und Upgrades.

    Typische RBMT-Komponenten:

    • · Sprachdatenbanken: - Zweisprachige Wörterbücher; - Namen der Namen, Transliteration; - Morphologische Tische.
    • · Übersetzungsmodul: - Grammatikregeln; - Übersetzungsalgorithmen.
    • · Vorteile von RBMT-Systemen:
      • - syntaktische und morphologische Genauigkeit;
      • - Stabilität und Vorhersagbarkeit des Ergebnisses;
      • - Fähigkeit, den Themenbereich anzupassen.
    • · Nachteile von RBMT-Systemen:
    • - Dauer der Betreuung und Entwicklung;
    • -Die Wertschätzung, um sprachliche Datenbanken zu pflegen und zu aktualisieren;
    • - "Maschinenakzent" beim Übersetzen.

    Statistische Machine Übersetzung. - Eine Art Maschinenübersetzung, in der die Übersetzung basierend auf statistischen Modellen erzeugt wird, deren Parameter von der Analyse von zweisprachigen Texten des Textes (Text-Corpora) abgeleitet werden.

    Statistische Machine Übersetzungskontrast-Computer-Übersetzungssysteme basierend auf Regeln, Regelbasierte Machine-Übersetzung (RBMT) und Beispiele, Beispielbasierte MT (EBMT).

    Die ersten Ideen der statistischen Machine wurden 1949 von Warren Weaver veröffentlicht. "Zweite Welle" - Anfang der 1990er Jahre, IBM. "Dritte Wave" - \u200b\u200bGoogle, Microsoft, Sprachweber, Yandex.

    Statistische Übersetzungsmodelle:

    • · Nach wortbasierter Übersetzung - WBT)
    • · Phrase-basierte Transaktion - PBT)
    • · Syntax (Syntax-basierte Übersetzung - SBT)
    • · Für hierarchische Phrasen (Hierachical Phrase-basierte Übersetzung - HPBT)

    Vorteile SMT:

    • · Schnelle Einstellung
    • · Einfach, neue Förderanweisungen hinzuzufügen
    • · Glätte Übersetzung

    Nachteile SMT:

    • · "Mangel" von parallelen Gebäuden
    • · Zahlreiche grammatikalische Fehler
    • · Übersetzungsinstabilität

    Maschinenübersetzungssysteme-Entwickler zur Verbesserung der Qualität werden von einigen "durch" -Regeln eingeführt, wodurch rein statistische Systeme drehen Hybrid-Maschinen-Übersetzung. Wenn Sie einige Regeln hinzufügen, dh die Erstellung von Hybridsystemen, verbessert die Qualität der Übersetzungen leicht, insbesondere mit einem unzureichenden Volumen der Eingabedaten, die beim Erstellen des Computerübersetzers verwendet werden.

    Hybrid-Machine-Übersetzung. - Integration verschiedener maschinenter Übersetzungsansätze von möglichen Optionen für MP:

    • · Regelbasierte Machine-Übersetzung (RBMT) - Machine-Übersetzung basierend auf Regeln.
    • · Corpus-basierte Machine-Übersetzung (CBMT) - Machine-Übersetzung auf Textgehäuse.
    • · Beispielbasierte Machine-Übersetzung (EBMT) -Maschine-Übersetzung in Beispielen.
    • · Statistische Machine Übersetzung (SMT) - Statistische Machine Übersetzung.

    Es wird erwartet, dass mit Hilfe der Hybridarchitektur die Vorteile dieser Ansätze kombiniert werden können.

    Die Hybrid-Übersetzungstechnologie beinhaltet die Verwendung statistischer Methoden zur Konstruktion von Vokabulardatenbanken auf der Grundlage paralleler Gebäude, der Bildung mehrerer möglicher Übersetzungen, sowohl auf lexikalischer Ebene als auch auf der Ebene der syntaktischen Struktur der Ausgangssprache, der Verwendung von Nach dem Getriebe im automatischen Modus und wählen Sie die beste (höchstwahrscheinlich) Übersetzung aus dem möglichen Sprachmodell basierend auf einem bestimmten Ausgangskorpus aus.

    Statistisches MPS versucht, sprachliche Daten zu verwenden, und Systeme mit einem "klassischen" Ansatz basierend auf den Regeln gelten statistische Methoden. Das Hinzufügen einiger "Cross-Creme-Creme-Creme-Regeln", dh die Erstellung von Hybridsystemen, verbessert die Erstellung von Hybridsystemen leicht die Qualität der Übersetzungen, insbesondere mit einem unzureichenden Eingangsbetrag, der zum Erstellen von Indexspeicherdateien der sprachlichen Informationen des Maschinenübersetzers auf Basis von N-Grams verwendet wird .

    Architektur der Hybridtechnologie "SMT und RBMT"[

    Das RBMT-System wird mit zwei Komponenten ergänzt: Statistisches Post-Execution-Modul und Sprachmodulmodul. Das statistische Nachgebäude ermöglicht es Ihnen, RB-Translation zu glätten, und bringen Sie sie in die natürliche Sprache und bei der Aufrechterhaltung einer klaren Struktur des synthetisierten Textes. Sprachmodelle werden verwendet, um die Glätte und die grammatische Richtigkeit der vom Hybridsystem erzeugten Übertragungsoptionen zu bewerten.

    Typische Architektur HMT.:

    • · Paralleles Gehäuse;
    • · Ausbildung;
    • · Langes Modell;
    • · Daten zur Nachbearbeitung;
    • · Syntheseregeln;
    • · Wörterbuch der Terminologie.

    Vorteile der Hybridübersetzung:

    • · Schnelle automatische Tuning basierend auf Translation Memory-Kunden;
    • · Terminologische Genauigkeit der Übersetzung sowie die Einheit des Stils;
    • · Empfangen zusätzlicher nützlicher Daten - ein zweisprachiges terminologisches Wörterbuch.

    Fazit

    Der Hauptvorteil der maschinellen Übersetzung ist, dass Sie mit sehr großen Textmengen schnell fertig werden können, und daher ist es teurer, die Übersetzung manuell zu übertragen. Es sollte daran erinnert werden, dass die Qualität der maschinellen Übersetzung immer den Menschen nachgeben wird. Daher ist es ratsam, es nur in bestimmten Fällen zu verwenden.

    Viele Arten von Materialien grundsätzlich sind nicht für die maschinelle Übersetzung gedacht. Es ist nicht unmöglich, den Fahrzeugtexten zu vertrauen, in denen die Ungenauigkeit der Übersetzung die menschliche Gesundheit gefährden kann, die Leistung eines komplexen Geräts oder eines großen Vertrags - die geringere Zeit nicht rechtfertigt das Risiko. Alle Dokumente, die die rechtliche Haftung implizieren, bedürfen der menschlichen Kontrolle. Die maschinelle Übersetzung ist ungeeignet für Marketingmaterialien, in denen der Text tatsächlich in einem neuen kulturellen Kontext aufgenommen wird und vorgegangen ist.

    Bei der Übersetzung streng formalisierter technischer Texte ist eine akzeptable Qualität zu erwarten, während künstlerische und Werbe-Texte nicht für die maschinelle Übersetzung geeignet sind.

    In der Machine-Übersetzung läuft es nicht nur, das gewünschte Ergebnis eindeutig vorzustellen und die Einschränkungen dieser Methode zu verstehen, sondern auch einen weiteren Faktor berücksichtigen. MP-Systeme erfordern in der Regel komplexe individuelle Einstellungen und Raffinesse, einschließlich "Lernen" zu einem bestimmten Thema - ohne dies zeigen sie viel schlechtere Ergebnisse. In dieser Hinsicht ist die Maschinenübersetzung sinnvoll, nur dann zu verwenden, wenn die riesigen Bände der gleichen Art von Texten übersetzt werden müssen. In diesem Fall wird es wirtschaftlich ratsam sein, eine bestimmte Zeit für das Systemtraining zu verbringen, und wenden Sie dann die Maschinenübersetzung an und erhalten Sie einen Text, der für den Ausguss geeignet ist. Wenn wir über mehrere Dutzend-Seiten sprechen, versuchen Sie, eine maschinelle Übersetzung sinnlos und einfach unrentabel einzuführen.

    Somit kann die maschinelle Übersetzung mit dem Postgebäude wirklich rentabel sein, wenn die Texte eines geeigneten Typs in sehr große Mengen übersetzt werden. Da große Transfers durch Übersetzungsunternehmen passieren, die oft auf bestimmte Themenbereiche spezialisiert sind, ist die Einführung von ziemlich wirksamen, aber teuren maschinellen Übersetzungssystemen der letzten Generation in solchen Unternehmen wirtschaftlich gerechtfertigt: Weder Inhaltsanbieter, auch wenn große, noch individuelle Übersetzer können Verwenden Sie unabhängig effektiv die maschinelle Übersetzung.

    Gebrauchte Bücher

    • 1. http://www.logrus.ru.
    • 2. http://www.moluch.ru/
    • 3. https://www.academia.edu.
    • 4. http://study-deutsch.info/

    Maschinenübersetzungsansätze.

    Maschinenübersetzungssysteme können eine Übersetzungsmethode basierend auf sprachlichen Regeln verwenden. Die am besten geeigneten Wörter aus der Originalsprache werden einfach durch die Wörter der Übersetzungssprache ersetzt.

    Es wird oft argumentiert, dass das Problem der maschinellen Übersetzung erfolgreich gelöst wird, das Problem des Verständnisses des Textes in einer natürlichen Sprache zu lösen.

    In der Regel verwendet die auf den Regeln basierende Übersetzungsmethode eine symbolische Darstellung (Intermediär), auf deren Grundlage der Text in der Übersetzungssprache erstellt wird. Und wenn wir die Natur des Vermittlers in Betracht ziehen, können Sie über interlinguistische maschinelle Übersetzung oder Übertragungsmaschinenübersetzung sprechen. Diese Methoden erfordern sehr große Wörterbücher mit morphologischen, syntaktischen und semantischen Informationen und einem großen Satz von Regeln.

    Wenn das maschinelle Übersetzungssystem über eine ausreichende Datenmenge verfügt, können Sie eine Übersetzung von guter Qualität erhalten. Die Hauptschwierigkeit liegt in der Bildung dieser Daten. Beispielsweise sind große Textgehäuse, die für statistische Übersetzungsmethoden zur Übersetzung, auf der Grundlage von Grammatik erforderlich sind, nicht ausreichend. Darüber hinaus ist für letztere eine zusätzliche Aufgabe der Grammatik erforderlich.

    In der Übersetzung von verwandten Sprachen (russisch, ukrainisch) kann es sich um eine ausreichende Änderung in Worten geben.

    Moderne maschinelle Übersetzungssysteme sind in drei große Gruppen unterteilt:

    · In den Regeln gegründet;

    · Basierend auf Beispielen;

    SMP basierend auf Regeln

    Machine-Übersetzungssysteme, die auf Regeln basieren - ein allgemeiner Begriff, der Maschinenübersetzungssysteme auf der Grundlage von sprachlichen Informationen über Quell- und Übersetzungssprachen anzeigt.

    Sie bestehen aus zweisprachigen Wörterbüchern und Grammatik, die die wichtigsten semantischen, morphologischen, syntaktischen Muster jeder Sprache abdecken. Dieser Ansatz zur maschinellen Übersetzung ist auch als klassischer.

    Basierend auf diesen Daten wird der Quelltext nacheinander nach Vorschlägen in den Übersetzungstext umgewandelt. Solche Systeme entgegen der Maschinenübersetzungssysteme, die auf Beispielen basieren.

    Das Prinzip des Betriebs solcher Systeme ist der Anschluss der Struktur des Eingabe- und Ausgabesatzes. Die Übersetzung ist nicht besonders gute Qualität. Aber auf einfachen Beispielen funktioniert.

    Übersetzung von Englisch nach Deutsch wird aussehen wie:

    Ein Mädchen isst einen Apfel. Ein Madchen Isst einen eigfel.

    Diese Systeme sind in drei Gruppen unterteilt:

    · Systeme der sozialen Übersetzung;

    · Transfersysteme;

    · Interlinguistisch;

    Intermittierende Übersetzung

    Solche Systeme sind nun aufgrund der schlechten Qualität der Übersetzung extrem selten. Die Wörter des Quelltextes werden in der Wortübersetzung umgewandelt (so wie sie). Oft tritt eine solche Umwandlung ohne Lemmomisierung und morphologische Analyse auf. Dies ist die einfachste Methode der maschinellen Übersetzung. Es wird verwendet, um lange Wörterlisten zu übersetzen (z. B. Verzeichnisse). Es kann auch verwendet werden, um eine Zuwiderhandlung für TM-Systeme zu erstellen.

    Transfersysteme

    Als Transfersysteme.Und die interlinguistische, haben die gleiche gemeinsame Idee. Für die Übersetzung ist es notwendig, einen Vermittler zu haben, der in an sich die Bedeutung des übersetzten Ausdrucks trägt. In interlinguistischen Systemen hängt der Mediator nicht von den Sprachenpaaren ab, während in Transfers - abhängig ist.

    Transfersysteme arbeiten auf einem sehr einfachen Prinzip: Der Eingabetext wendet die Regeln an, die in Übereinstimmung mit der Struktur der ursprünglichen und übersetzten Sprachen eingesetzt werden. Die anfängliche Arbeitsphase umfasst morphologische, syntaktische (und manchmal semantische) Textanalysen, um eine interne Darstellung zu erstellen. Die Übersetzung wird aus dieser Präsentation mit zweisprachigen Wörterbüchern und grammatikalischen Regeln generiert. Erstellen Sie manchmal auf der Grundlage der primären Darstellung, die aus dem Quelltext erhalten wurde, mehr "abstrakte" interne Darstellung aufbauen. Dies geschieht, um die für die Übersetzung wichtige Orte zu betonen und die unbedeutenden Teile des Textes zu verwerfen. Beim Bau des Textes der Übersetzung erfolgt die Umwandlung interner Darstellungen in umgekehrter Reihenfolge.

    Bei der Verwendung dieser Strategie gibt es eine ausreichend hohe Qualität der Übersetzungen mit Genauigkeit in der Fläche von 90% (obwohl er stark vom Sprachpaar abhängig ist). Die Arbeit eines beliebigen Systems der Übertragungsübersetzung besteht aus mindestens fünf Teilen:

    · Morphologische Analyse;

    · Lexikalische Übertragung;

    · Strukturübertragung;

    · Morphologische Erzeugung.

    Morphologische Analyse. Die Wörter des Quelltextes werden in Teilen der Sprache eingestuft. Ihre morphologischen Anzeichen werden offenbart. Das Wort Lemmas wird bestimmt.

    Lexikalische Kategorisierung. In jedem Text können einige Wörter mehr als einen Wert aufweisen, wodurch die Mehrdeutigkeit in der Analyse verursacht wird. Bei der lexikalischen Kategorisierung wird der Wortkontext erkannt. Es gibt verschiedene Arten von Markierungen und Klarstellungen.

    Lexikalische Übertragung. Basierend auf einem zweisprachigen Wörterbuch werden die Wörter übersetzt. Die Aktion ist der interpretierten Übersetzung sehr ähnlich.

    Strukturübertragung. Worte stimmen im Vorschlag überein.

    Morphologische Generation. Basierend auf der Ausgabe der Strukturübertragung wird das Word-Konvertierungswort erstellt.

    Eines der Hauptmerkmale der transfinierten Maschinenübersetzungssysteme ist die Bühne, in der die Zwischendarstellung des Textes in der Originalsprache in die Zwischendarstellung des Textes in der Zielsprache übertragen wird. Es kann an einem der zwei Ebenen der sprachlichen Analyse oder sofort auf beiden arbeiten.

    1. Übertragung der Oberfläche (syntaktisch). Dieses Niveau ist durch die Übertragung von "syntaktischen Strukturen" zwischen Quelle und Translationssprache gekennzeichnet. Geeignet für Sprachen in derselben Familie oder demselben Typ, zum Beispiel in romanischen Sprachen, zwischen italienischem Spanisch, Katalanisch, Französisch usw.

    2. Tiefe (semantische) Übertragung. Der Niveau zeichnet sich durch eine semantische Darstellung aus. Es hängt von der Originalsprache ab. Diese Präsentation kann aus einer Reihe von Strukturen bestehen, die den Wert darstellen. Die Übersetzung erfordert in der Regel auch einen strukturellen Transfer. Diese Ebene wird verwendet, um zwischen mehr Remote-Sprachen zu übersetzen.

    Interlinguistische Machine Übersetzung.

    Interlinguistische Machine-Übersetzung ist eine der klassischen Ansätze für die maschinelle Übersetzung. Quelle Der Text wird in eine abstrakte Darstellung umgewandelt, die nicht von der Sprache abhängt (im Gegensatz zur Übertragungsübersetzung). Der Übersetzungstext wird basierend auf dieser Präsentation erstellt. Der Hauptvorteil dieses Ansatzes ist, dass das System eine neue Sprache hinzufügt. Sie können mathematisch erweisen, dass im Rahmen dieses Ansatzes die Erstellung jedes neuen Sprachinterpreters für ein solches System ihn reduzieren, zum Beispiel mit einem Transfering-Übersetzungssystem verglichen. Außerdem können Sie im Rahmen dieses Ansatzes Sie

    · Implementieren Sie "Retelling-Text", um den Quelltext in einer einzigen Sprache umkippen;

    · Relativ einfache Implementierung, sehr unterschiedliche Sprachen übersetzen, z. B. Russisch und Arabisch.

    Es gibt jedoch immer noch keine Implementierung dieses Ansatzes, der mindestens zwei Sprachen ordnungsgemäß funktionieren würde. Viele Experten drückten Zweifel an der Möglichkeit einer solchen Umsetzung. Die Schwierigkeiten, solche Systeme zu erstellen, besteht darin, eine internespektive Präsentation zu entwerfen. Es sollte gleichzeitig abstrakt und unabhängig von bestimmten Sprachen sein, aber gleichzeitig sollte es die Merkmale jeder vorhandenen Sprache widerspiegeln. Andererseits ist im Rahmen der künstlichen Intelligenz die Aufgabe, die Bedeutung des Textes im Moment noch nicht zuzusetzen, noch nicht gelöst.

    Zum ersten Mal wurde der interlinguistische Ansatz im 17. Jahrhundert Descartes und Leibnitsa vorgeschlagen, der universelle Wörterbücher mit numerischen Codes anbot. Andere, wie Cave Beck, Athanasius Kirger und Johann Joachim Becher, arbeiteten an der Entwicklung einer eindeutigen Universalsprache, die auf den Prinzipien der Logik- und Ikonographie basiert.

    Im Jahr 1668 sprach John Wilkins in der Abhandlung "Erfahrung über echte Symbolik und Philosophische Sprache" über seine Interlingu.

    Im 18. und 19. Jahrhundert wurden viele Universalsprachen entwickelt, darunter Esperanto. Es ist bekannt, dass sich die Idee einer universellen Sprache für die maschinelle Übersetzung in der Erstphase der Entwicklung dieser Technologie auf keinen Fall manifestiert. Stattdessen wurden nur wenige Sprachen berücksichtigt. In den 1950er und 60er Jahren wurden jedoch Forscher in Cambridge von Margaret Masterman in Leningrad von Nikolai Andreev und in Mailand Silvio Ceccato in dieser Gegend begonnen.

    In den 1970er und 1980er Jahren wurden bestimmte Erfolge in diesem Bereich hergestellt, und es wurden einige Maschinenkinderübersetzungssysteme errichtet.

    In dieser Übersetzungsmethode kann die interne Repräsentation als ein Weg angesehen werden, um die Analyse des Textes in der Originalsprache zu beschreiben. Gleichzeitig bleibt die Präsentation morphologische, syntaktische Eigenschaften des Textes erhalten. Es wird angenommen, dass diese Weise beim Erstellen eines Übersetzungstextes "Bedeutung" übermittelt werden kann.

    Gleichzeitig werden manchmal zwei interlagige Darstellungen verwendet. Einer von ihnen spiegelt die Eigenschaften der Quellsprache wider. Andere - Übersetzungssprache. Die Übersetzung in diesem Fall wird in zwei Schritten durchgeführt.

    In einigen Fällen werden zwei oder mehr Darstellungen einer Ebene verwendet (gleichermaßen nahe bei beiden Sprachen), unterscheiden sich jedoch im Subjekt. Dies ist notwendig, um die Qualität der Übersetzung bestimmter Texte zu verbessern.

    Dieser Ansatz ist nicht neu für Linguistik. Es basiert auf den Ideen der Nähe der Sprachen. Um die Qualität der Übersetzung zu verbessern, wird die natürliche Sprache als Brücke zwischen zwei anderen Sprachen genutzt. Wenn Sie beispielsweise aus ukrainischem In Englisch übersetzen, wird manchmal die russische Sprache verwendet.

    Um das interlinguistische Maschinenübersetzungssystem zu nutzen, benötigt:

    · Wörterbücher zum Analysieren und Erzeugen von Texten;

    · Beschreibung der Grammatiksprachen;

    · Die Wissensbasis der Konzepte (zur Erstellung einer Interructate-Präsentation);

    · Regeln für die Projektion von Konzepten für Sprachen und Präsentation.

    Das schwierigste Moment beim Erstellen dieses Typs ist die Unfähigkeit, eine Datenbank für weite Wissensbereiche zu erstellen. Und diese Grundlagen, die für sehr spezifische Themen erstellt werden, haben eine hohe rechenkomplexe Komplexität.

    Machine oder eher eine Computerübersetzung ist auch eine schriftliche Übersetzung, da wir infolgedessen einen schriftlichen Text erhalten. Es ist jedoch nicht übersetzer, sondern ein spezielles Computerprogramm. Moderne Computerübersetzungsprogramme sind ganz perfekt, aber sie können die schwierigste Aufgabe des Übersetzungsprozesses immer noch nicht lösen: Die Wahl der kontextut notwendigsten Option, die in jedem Text auf viele Gründe ausfällt. Derzeit kann das Ergebnis dieser Art der Übersetzung als grobe Version des zukünftigen Textes verwendet werden, der den Übersetzer bearbeitet, sowie ein Mittel, um den Mangel an Übersetzer eine allgemeine Idee des Themas zu erhalten und Textinhalt.

    Eine noch schwierigere Aufgabe besteht darin, den mündlichen Text mit Computerprogrammen zu übersetzen, da das Problem der Spracherkennung nur in der Anfangsphase seiner Lösung ist. Bisher ist ein unwiderstehliches Hindernis die individuelle Farbe des Sprachsegments - in einer beliebigen Sprache ist diese Rede schlecht formalisiert.

    Die Vorbearbeitung der syntaktischen Struktur kann in:

    · brechen über eine langfristige Versorgung (mehr als 40 Wörter) auf ein etwas kürzeres, Hinzufügen (falls erforderlich) Bindemittelelemente;

    · einführung in den englischen Text von Artikeln, wo es notwendig oder grammatisch gerechtfertigt ist;

    · wiederholung von Elementen schriftlich Phrasen in den Vorschlag;

    · die Einführung von Gewerkschaften bei Verwendung der Nichtgewerkschaftsbeziehung zwischen den Vorschlägen;

    · beseitigen Sie Strukturen in Klammern in der Mitte der eingetragenen Gruppe oder in der Mitte des Satzes;

    · ersetzen gelegentlicher Abkürzungen bei vollständigen Namen oder der Einführung von Sonderzeichen, die ihre Übersetzung nicht zulassen;

    · beseitigen Sie lexikalische und logische Ellipsen, informelle Strukturen und Metaphern;

    · zu einer einzelnen Art von Strukturen oder komplexen Wörtern, die im Text in der Jigsno, in der Hyphenne und dem kostenlosen Schreiben auftreten können.

    Der von manuell bearbeitete Text wird dann automatisch im MP-System verarbeitet.

    25. Allgemeines Maschinenübersetzungsschema.

    Weltweit ist der Einsatz von Maschinenübersetzungssystemen trotz aller Schwachstellen lang lang ein Element der professionellen Arbeit des Übersetzers, der den Computer nicht nur als Schreibmaschine verwenden kann. Das Konzept eines automatisierten Arbeitsplatzes des Übersetzers, einschließlich eines Komplexes von Resident-Wörterbüchern, Thesaurus, Rechtschreibsystemen, Informationszugriffssystemen auf verschiedenen Datennetzen sollten in Hilfe eines professionellen Spezialisten aufgenommen werden.

    Machine-Übersetzungssystem (MP) -Texte können als Teil eines solchen Arbeitsplatzes eines automatisierten Übersetzers verwendet werden, während eine qualitativ hochwertige Übersetzung bereitgestellt wird, die starr auf einen bestimmten Themenbereich, der Benutzeraufgabe und der Art der Dokumentation fokussiert ist. Darüber hinaus kann ein solches System einem Benutzer helfen, der keine Fremdsprache kennt, sehr schnell und mit geringen Kosten, um eine ungefähre (raue) Übersetzung von Texten in der Kenntnis des Wissens, an dem Sie interessiert sind, ausreichend, reicht aus, um Informationen zu verstehen, um übertragene Informationen zu verstehen durch den Text in einer Fremdsprache.

    Allgemeine Anforderungen an praktische Systeme

    machine-Übersetzung (MP)

    · Systemstabilitätssystem.. Das MP-System sollte ein Ergebnis ergibt, das auch bei Defekten des Quellmaterials und der Unvollständigkeit des Vokabulars verwendet werden kann.

    · Systemkollaboration.. Das System sollte über ausreichende einfache Software und sprachliche Mittel verfügen, um seine Anwendungen auszubauen.

    · Anpassungssystem. Das MP-System muss Konfigurationstools für bestimmte Benutzer und die Funktionen der verarbeiteten Dokumente verfügen.

    · Optimalität der temporären Parameter. Die Übertragungsrate von Texten sollte entweder dem in einem Gerät oder dem Benutzerstandards eingehenden Informationsvolumen entsprechen.

    · Comfort-Benutzer. Service-Tools des Systems müssen den Anwender des Benutzers in allen möglichen Systemmodi in allen bereitstellen.

    Wenn Sie mit einem bestimmten maschinellen Übersetzungssystem arbeiten, müssen Sie daran denken, dass die Übersetzung auf mehreren gemütlichen Ebenen der Systemimplementierung durchgeführt wird.

    Solche Ebenen im Allgemeinen umfassen:

    · das Niveau des automatischen Textvorflugs;

    · ebene der lexiko-morphologischen Analyse;

    · kontextanalyse und Analyse von Gruppen;

    · das Niveau der Analyse der funktionalen Segmente;

    · analyse der Analyse von Vorschlägen;

    · der Synthesepegel des Ausgabetextes;

    · automatisches Haftniveau.