Rozdział. 3. Okna i okna dialogowe

1. Właściwości projektu
1.1. Języki
1.2. Opcje
1.3. Lokalizacja plików
2. Pliki projektu
3. Przeszukiwanie tekstu
3.1. Używanie symboli wieloznacznych
3.2. Metody i opcje wyszukiwania
3.3. Wyświetlanie wyników wyszukiwania
3.4. Filtruj wpisy w edytorze według wyszukiwania
4. Zastępowanie tekstu
4.1. Opcje przeszukiwania
5. Wyrównanie
5.1. Krok 1: dostosuj parametry wyrównania
5.2. Krok 2: Przeprowadź ręczną korekcję
6. Skrypty
6.1. Zastosowanie
6.2. Języki skryptowe
7. Ogólne preferencje
7.1. Ogólne
7.2. Tłumaczenie maszynowe
7.3. Glosariusz
7.4. Słownik
7.5. Wygląd
7.6. Filtry plików
7.7. Reguły segmentacji
7.8. Autouzupełnienie
7.9. Sprawdzanie pisowni
7.10. Narzędzia językowe wtyczki
7.11. Zewnętrzne przeszukiwanie
7.12. Edytor
7.13. Przetwarzanie znaczników
7.14. Team
7.15. Dopasowanie TM
7.16. Widok
7.17. Zapisz i przetwórz
7.18. Logowanie do serwera proxy
7.19. Bezpieczeństwo danych
7.20. Wtyczki
7.21. Aktualizacje

Różnica jest niewielka: nazywamy „Okno” oknem, które może pozostać otwarte obok edytora i wchodzić z nim w interakcję, a „okno dialogowe” jest oknem, w którym należy wybrać parametry przed zamknięciem i wykonaniem tłumaczenia.

1. Właściwości projektu

To okno dialogowe jest dostępne po wybraniu opcji ProjektWłaściwości...

1.1. Języki

Możemy ręcznie wprowadzić nazwę języka źródłowego i docelowego lub skorzystać z menu rozwijanego. Należy pamiętać, że zmiana języków może spowodować, że aktualnie używane pamięci tłumaczeń staną się bezużyteczne, ponieważ ich para językowa może już nie pasować do nowych języków.

Wyświetlane są znaczniki językowe odpowiadające wybranym językom.

1.2. Opcje

Włączamy segmentację na poziomie zdań

Ustawienia segmentacji dotyczą tylko sposobu, w jaki pliki źródłowe są obsługiwane przez program OmegaT. Najpopularniejszym sposobem segmentacji plików źródłowych jest segmentacja na poziomie zdania, więc to pole wyboru zwykle powinno pozostać zaznaczone.

W niektórych rzadkich przypadkach może być preferowane alternatywne ustawienie, tj. segmentacja na poziomie akapitów. Modyfikacja tego znacznika nie zmienia segmentacji w już istniejących pamięciach tłumaczeniowych. Jeżeli zdecydujemy się przełączyć z tłumaczenia zdań na akapity, wewnętrzna pamięć tłumaczeń projektu nie zostanie zmieniona (OmegaT może zaktualizować stare pamięci tłumaczeniowe, które nie używały segmentacji zdań, jednak nie odwrotnie), a w takim wypadku OmegaT spróbuje utworzyć rozmyte dopasowania akapitów, sklejając istniejące tłumaczenia zdań.

Zmiana ustawień segmentacji może spowodować podzielenie lub scalenie niektórych już przetłumaczonych segmentów. W rzeczywistości przywróci im to status „nieprzetłumaczonych”, ponieważ nie będą już odpowiadać segmentom zapisanym w pamięci projektu, nawet jeżeli ich oryginalne tłumaczenie jest tam nadal obecne.

Automatyczne rozpowszechnianie tłumaczeń

W przypadku, gdy w dokumentach źródłowych znajdują się nieunikalne segmenty, pole wyboru autopropagacja oferuje użytkownikowi dwie możliwości automatycznego tłumaczenia: jeżeli zaznaczony, pierwszy przetłumaczony segment zostanie przyjęty jako domyślne tłumaczenie, i będzie automatycznie używany jako tekst docelowy w kolejnych identycznych segmentach podczas procesu tłumaczenia. Błędnie przetłumaczone segmenty można oczywiście później ręcznie poprawić za pomocą opcji Utwórz tłumaczenie alternatywne. Jeżeli pole wyboru autopropagacji nie jest zaznaczone, segmenty z alternatywnymi tłumaczeniami pozostają nieprzetłumaczone, dopóki użytkownik nie zdecyduje, które tłumaczenie ma zostać użyte.

Usuń znaczniki

Po włączeniu wszystkie znaczniki formatujące są usuwane z segmentów źródłowych. Jest to szczególnie przydatne w przypadku tekstów, w których formatowanie wbudowane nie jest zbyt przydatne (np. OCRed PDF, źle przekonwertowany plik .odt lub .docx itp.). W normalnym przypadku zawsze powinno być możliwe otwarcie dokumentów docelowych, ponieważ tylko w tekście znaczniki są usuwane. Formatowanie niewidoczne (tj. takie którego znaczniki nie pojawiają się w edytorze programu OmegaT) jest zachowywane w dokumentach docelowych.

Zewnętrzne polecenie przetwarzania końcowego

W tym obszarze można wprowadzić zewnętrzne polecenie przetwarzania końcowego (na przykład skrypt do zmiany nazw plików), które zostanie zastosowane za każdym razem, gdy zostanie użyte polecenie Utwórz przetłumaczone dokumenty. Takie zewnętrzne polecenie nie może zawierać „potoków” itp., dlatego zalecane jest wywołanie skryptu.

Segmentacja...

Ogólnie zasady segmentacji obowiązują dla wszystkich projektów. Jednak użytkownik może potrzebować utworzenia specyficznego zestawu reguł, który będzie miał zastosowanie do danego projektu. Użyj tego przycisku, aby otworzyć okno dialogowe, aktywuj pole wyboru Zastosuj reguły segmentacji, a następnie przejdź do ich dostosowywania według potrzeb. Nowy zestaw reguł zostanie zapisany wraz z projektem i nie będzie kolidował z ogólnym zestawem reguł segmentacji. Aby usunąć reguły segmentacji specyficzne dla projektu, należy usunąć zaznaczenie wybranego pola. Więcej informacji na temat reguł segmentacji znajdziemy w rozdziale o ustawianiu reguł segmentacji.

Wskazówka: zestaw reguł segmentacji dla danego projektu jest przechowywany jako project/omegat/segmentation.conf.

Filtry plików...

W podobny sposób, jak powyżej, użytkownik może tworzyć filtry plików specyficzne dla projektu, które będą przechowywane razem z projektem i będą obowiązywać tylko w bieżącym projekcie. Aby utworzyć zestaw filtrów plików dla konkretnego projektu, klikamy przycisk Filtr plików..., a następnie zaznaczamy pole wyboru Włącz filtry specyficzne dla projektu w oknie, które zostanie otwarte. Kopia zmienionej konfiguracji filtrów zostanie zapisana w projekcie. Aby usunąć filtry plików specyficzne dla projektu, usuwamy odpowiednie zaznaczenie pola wyboru. Należy zauważyć, że w menu Opcje → Filtry plików zmieniane są globalne filtry użytkowników, a nie filtry projektów. Więcej informacji uzyskamy w rozdziale o preferencjach filtrów plików.

Wskazówka: zestaw filtrów plików dla danego projektu jest przechowywany jako projekt/omegat/filters.xml.

Odwzorowanie repozytoriów...

Podczas pracy nad projektem zespołowym to okno umożliwia zdefiniowanie mapowania między katalogami zdalnymi i lokalnymi (przejrzyj dostępne tutaj przykłady).

Zewnętrzne przeszukiwanie...

Definiuje zewnętrzne zasoby wyszukiwania specyficzne dla projektu.

1.3. Lokalizacja plików

Tutaj możemy wybrać różne podkatalogi, na przykład podkatalog z plikami źródłowymi, podkatalog dla plików docelowych itp. Jeżeli wprowadzimy nazwy katalogów, które jeszcze nie istnieją, program OmegaT utworzy je za nas. Jeżeli zdecydujemy się zmodyfikować katalogi projektu, pamiętajmy, że nie spowoduje to przeniesienia istniejących plików ze starych katalogów do nowej lokalizacji.

Wybieramy Wyłączenia... aby zdefiniować pliki lub katalogi, które będą ignorowane przez program OmegaT. Zignorowany plik lub katalog:

  • nie jest wyświetlany w oknie edytora,

  • nie jest uwzględniany w statystykach,

  • nie jest kopiowany do katalogu (docelowego) /target podczas procesu tworzenia przetłumaczonych plików.

W oknie dialogowym Wzorce wykluczeń można dodać lub usunąć wzorzec lub edytować go, wybierając linię i naciskając klawisz F2. Możliwe jest wykorzystanie symboli wieloznacznych, używając składni ant.

2. Pliki projektu

To okno jest otwierane automatycznie za każdym razem, kiedy program OmegaT otwiera projekt i za każdym razem po kliknięciu ProjektPliki projektu...

Notatka: można zablokować wyświetlanie okna plików projektu, ustawiając opcję project_files_show_on_load na wartość false w pliku omegat.prefs (dostępnym przez menu OpcjeDostęp do katalogu konfiguracji).

Użyj kombinacji Ctrl+L aby go otworzyć i Esc aby go zamknąć. W oknie pliki projektu wyświetlane są następujące informacje:

  • Łączna liczba plików do przetłumaczenia w projekcie. Są to pliki obecne w katalogu /source w formacie rozpoznawanym przez program OmegaT. Liczba ta jest wyświetlana w nawiasach obok tytułu „plik projektu”.

  • Lista wszystkich plików do przetłumaczenia w projekcie. Kliknięcie dowolnego pliku spowoduje otwarcie go do tłumaczenia.

    Wpisanie dowolnego tekstu spowoduje otwarcie pola filtru, w którym można wprowadzić części nazw plików. Możesz wybrać plik za pomocą klawiszy strzałek w górę i w dół, otwierając plik do tłumaczenia, zatwierdzając klawiszem Enter.

    Notatka: nazwy plików (w pierwszej kolumnie) można sortować alfabetycznie, klikając nagłówek. Można również zmienić położenie nazwy pliku, klikając na nią i naciskając przycisk Przenieś...

    Kliknięcie prawym przyciskiem myszy na nazwie pliku powoduje otwarcie wyskakującego okienka, które umożliwia otwarcie pliku źródłowego i (jeśli istnieje) pliku docelowego.

  • Wpisy plików obejmują ich nazwy, typy filtrów plików, ich kodowanie oraz liczbę segmentów, które zawiera każdy z nich.

  • Łączna liczba segmentów, liczba unikalnych segmentów w całym projekcie oraz liczba unikalnych segmentów już przetłumaczonych są pokazane na dole.

Zestaw unikalnych segmentów jest obliczany poprzez pobranie wszystkich segmentów i usunięcie wszystkich zduplikowanych. (W definicji „unikatowy” rozróżniana jest wielkość liter: „Uruchom” i „uruchom” są traktowane jako różne).

Różnica między „Liczbą segmentów” a „Liczbą unikalnych segmentów” daje przybliżony obraz liczby powtórzeń w tekście. Zwróć jednak uwagę, że liczby nie wskazują, jak trafne są powtórzenia: mogą oznaczać stosunkowo długie zdania powtarzane kilka razy (w takim przypadku masz szczęście) lub mogą opisywać tabelę słów kluczowych (nie tak pomyślnie). project_stats.txt znajdujący się w katalogu omegat twojego projektu zawiera bardziej szczegółowe informacje o segmencie, podzielony według plików.

Modyfikacja reguł segmentacji może skutkować modyfikacją liczby segmentów/unikalnych segmentów. Należy tego jednak zasadniczo unikać po rozpoczęciu tłumaczenia projektu. Więcej informacji można znaleźć w rozdziale reguły segmentacji.

Dodanie plików do projektu: możemy dodawać pliki źródłowe do projektu, przez kliknięcie przycisku „Importuj pliki źródłowe...”. Skutkuje to skopiowaniem wybranych plików do katalogu source i ponownym wczytaniem projektu w celu importowania nowych plików. Można także dodawać pliki źródłowe jako strony internetowe, utworzone w formacie MediaWiki, przez kliknięcie przycisku „Importuj z MediaWiki” - podając odpowiedni adres URL.

3. Przeszukiwanie tekstu

Otwieramy okno wyszukiwania za pomocą kombinacji klawiszy Ctrl+F i wpisujemy słowo lub frazę, które zamierzamy odnaleźć, w pole wyszukaj.

Alternatywnie możemy wybrać słowo lub frazę w oknie Edycji, w oknie Dopasowań rozmytych lub w oknie Słownika i nacisnąć kombinację klawiszy Ctrl+F. Słowo lub fraza jest automatycznie wprowadzane w pole Wyszukaj. Możemy mieć jednocześnie otwartych kilka okien wyszukiwania, ale zamykajmy je, gdy nie są już potrzebne, aby nie zaśmiecały pulpitu.

Klikając strzałkę menu rozwijanego pola Wyszukaj, uzyskujemy dostęp do 10 ostatnich wyszukiwań.

Okno wyszukiwania ma własne menu:

  • Plik → Wyszukaj zaznaczenie (Ctrl+F): ponownie zwróćmy uwagę na pole wyszukiwania i zaznaczmy całą jego zawartość.

  • Plik → Zamknij (Ctrl+W): zamknij okno wyszukiwania (tak samo jak z pomocą Esc).

  • Edycja → Wstaw źródło (Ctrl+Shift+I): wstaw bieżącą wersję segmentu źródłowego.

  • Edycja → Zastąp źródłem (Ctrl+Shift+R): zastąp bieżącą wersję segmentu źródłowego.

  • Edycja → Utwórz hasło do glosariusza (Ctrl+Shift+G): dodaj nowe hasło glosariusza.

3.1. Używanie symboli wieloznacznych

Zarówno w wyszukiwaniu dokładnym, jak i przy wyszukiwaniu według słów kluczowych, znaki wieloznaczne wyszukiwania „*” i „?” mogą być używane. Mają znaczenie znaki znane użytkownikom wielu edytorów tekstowych:

  • '*' dopasowuje zero lub więcej znaków, od aktualnej pozycji w danym słowie do jego końca. Przykładowo zadane wyszukiwanie 'run*' będzie pasowało do słów 'run', 'runs' i 'running'.

  • '?' dopasowuje dowolny pojedynczy znak. Przykładowo zadane wyszukiwanie 'run?' dopasuje słowa 'runs' i 'runn' zawarte w słowie 'running'.

Dopasowania zostaną wyświetlone pogrubioną niebieską czcionką. Zauważmy, że znaki '*' i '?' mają specjalne znaczenie w wyrażeniach regularnych, więc wyszukiwanie za pomocą symboli wieloznacznych, jak opisano tutaj, dotyczy tylko wyszukiwania dokładnego i wyszukiwania według słów kluczowych (patrz poniżej).

3.2. Metody i opcje przeszukiwania

Wybierzmy metodę za pomocą przycisków odpowiednich opcji. Dostępne są następujące metody wyszukiwania:

dokładne przeszukiwanie

Wyszukajmy segmenty zawierające dokładnie określony ciąg znaków. Dokładne wyszukiwanie polega na wyszukaniu frazy, tj. jeżeli wprowadzono kilka słów, zostaną one znalezione tylko wtedy, gdy występują dokładnie w tej kolejności. Wyszukiwanie frazy open file spowoduje więc znalezienie wszystkich wystąpień ciągu open file, ale nie file opened lub open input file.

szukanie według słowa kluczowego

Wyszukajmy segmenty zawierające wszystkie określone słowa kluczowe w dowolnej kolejności. Wybierzmy wyszukiwanie słów kluczowych, aby wyszukać dowolną liczbę pojedynczych pełnych słów w dowolnej kolejności. Program OmegaT wyświetli listę wszystkich segmentów zawierających wszystkie podane słowa. Wyszukiwanie słów kluczowych jest podobne do wyszukiwania „ze wszystkimi słowami” w wyszukiwarce internetowej, takiej jak DuckDuckGo (logika AND). Korzystanie z wyszukiwania słów kluczowych z open file spowoduje znalezienie wszystkich wystąpień ciągu open file, a także file opened, open input file, file may not be safe to open, itp.

wyrażenia regularne

Wyszukiwany ciąg będzie traktowany jako wyrażenie regularne. Ciąg wyszukiwania - [a-zA-Z]+[ąćęłńóśżźĄĆĘŁŃÓŚŻŹ] - na przykład w powyższym przykładzie szuka słów w segmencie docelowym, zawierających dodatkowe znaki z klawiatury polskiej. Wyrażenia regularne to potężne narzędzie wyszukiwania żądanych zestawów znaków.

Oprócz jednej z powyższych metod możemy jeszcze wybrać sposób wyszukiwania:

  • z uwzględnieniem wielkości liter: wyszukiwanie zostanie przeprowadzone dla dokładnie określonego ciągu; tj. znajdowanie kapitalików.

  • dopasowanie spacji nbsp: gdy ta opcja jest zaznaczona, znak spacji umieszczony w wyszukiwanej pozycji może pasować albo do zwykłego znaku spacji, albo do znaku spacji nierozdzielnej (\u00A).

  • w źródle: wyszukiwanie w segmentach źródłowych

  • w tłumaczeniach: wyszukiwanie w segmentach docelowych

  • w notatkach: wyszukiwanie w notatkach do segmentów

  • w komentarzach: wyszukiwanie w komentarzach do segmentów

  • przetłumaczone lub nieprzetłumaczone: szukaj zarówno przetłumaczonych, jak i nieprzetłumaczonych segmentów

  • przetłumaczone: szukaj tylko w przetłumaczonych segmentach

  • nieprzetłumaczone: szukaj tylko w nieprzetłumaczonych segmentach

  • wyświetl: wszystkie pasujące segmenty: jeżeli zaznaczona, wszystkie segmenty są wyświetlane jeden po drugim, nawet jeżeli występują kilka razy w tym samym dokumencie lub w różnych dokumentach

  • wyświetl: nazwy plików: jeżeli zaznaczona, nazwa pliku, w którym znajduje się każdy segment, jest wyświetlana nad każdym wynikiem

  • przeszukaj projekt: sprawdź pamięć aby uwzględnić w wyszukiwaniu pamięć projektu (plik projekt_save.tmx). Zaznaczmy bazy pamięci tłumaczeniowych TM aby podczas wyszukiwania uwzględnić te znajdujące się w katalogu tm. Zaznaczmy opcję glosariusze aby uwzględnić je podczas wyszukiwania i te znajdujące się w katalogu glosariuszy.

  • szukaj w plikach: szukaj w pojedynczym pliku lub katalogu zawierającym zestaw plików. Podczas wyszukiwania plików (w przeciwieństwie do pamięci tłumaczeń) program OmegaT ogranicza wyszukiwanie do plików w źródłowych formatach plików. W związku z tym, chociaż OmegaT jest prawdziwie zdolny wykorzystywać pliki tmx, to nie włącza ich w opcję przeszukiwaniu plików.

Klikając na przycisk Opcje zaawansowane można wybrać dodatkowe kryteria (autor lub zmieniający tłumaczenie, data tłumaczenia, z wyłączeniem segmentów osieroconych itp.). Gdy zaznaczona jest opcja niewrażliwości znaków o pełnej/połowie szerokości wyszukiwanie formularzy o pełnej szerokości (znaki CJK) będzie pasowało do formularzy o połowie szerokości i odwrotnie.

3.3. Wyświetlanie wyników przeszukiwania

Naciśnięcie przycisku wyszukiwania po wpisaniu ciągu znaków w polu wyszukiwania powoduje wyświetlenie wszystkich segmentów w projekcie, które zawierają wprowadzony ciąg. Ponieważ program OmegaT obsługuje identyczne segmenty jako jedną całość, wyświetlany jest tylko pierwszy unikalny segment. Segmenty są wyświetlane w kolejności występowania w projekcie. Przetłumaczone segmenty są wyświetlane z oryginalnym tekstem na górze, a przetłumaczonym na dole, nieprzetłumaczone segmenty są wyświetlane tylko jako źródło.

Dwukrotne kliknięcie segmentu otwiera go w oknie edycji w celu modyfikacji (jedno kliknięcie robi to, gdy zaznaczona jest opcja Autosynchronizacja z edytorem). Następnie możemy przełączyć się z powrotem do okna wyszukiwania w celu znalezienia następnego wyszukanego segmentu, na przykład w celu sprawdzenia i jeżeli to konieczne, poprawienia terminologii.

W oknie wyszukiwania możemy używać standardowych skrótów klawiaturowych (Ctrl+N, Ctrl+P), aby przechodzić z jednego segmentu do drugiego.

W tym samym czasie może być otwartych kilka okien wyszukiwania. Można szybko przejrzeć ich zawartość, patrząc na tytuły: będą zawierały użyte terminy wyszukiwania.

3.4. Filtruj wpisy w edytorze według wyszukiwania

Aby ułatwić nawigację w zestawieniu wyników wyszukiwania, możemy zastosować wyszukiwanie do edytora. Naciskamy przycisk Filtruj na dole, aby ograniczyć pozycje wyświetlane w oknie edytora do tych, które pasują do bieżącego wyszukiwania. Możemy skorzystać z normalnej nawigacji, aby przejść np. następny (nieprzetłumaczony) segment, który spełnia kryteria wyszukiwania.

Uwaga:

  • Wyszukiwanie może być ograniczone do 1000 pozycji, więc jeżeli wyszukujemy według wspólnej frazy, edytor wyświetla wtedy tylko 1000 pasujących pozycji, a nie wszystkie wpisy, które spełniają kryteria wyszukiwania.

  • Plik może nie zawierać pasujących wpisów, więc będzie pusty.

  • Jeżeli wyszukiwanie usuwa duplikaty, te duplikaty nie będą wyświetlane w edytorze.

Aby usunąć filtr, naciśnij przycisk Usuń filtr lub zamknij i ponownie wczytaj projekt.

4. Zastępowanie tekstu

Otwórz okno wyszukaj i zamień za pomocą Ctrl+K i wprowadź słowo lub wyrażenie, które chcesz zamienić, w polu wyszukaj.

Następnie kliknij przycisk szukaj , aby wyświetlić wszystkie odpowiednie wystąpienia.

Wprowadź nowe słowo lub frazę (wyrażenia regularne nie są obsługiwane) w polu zamień na, a następnie kliknij jedną z następujących opcji:

  • Zastąp wszystko: obsługuje zastępowanie wszystkich wystąpień (po wyświetleniu okna potwierdzenia, w którym wyświetlana jest liczba wystąpień).

  • Zastąp: obsługuje zamianę „jeden po drugim” za pomocą przycisków w nagłówku okna edytora. Kliknij przycisk zastąp następny lub pomiń, a następnie zakończ sesję zastępowania przyciskiem zakończ.

  • Zamknij: zamknij okno bez dokonania zmian.

4.1. Opcje przeszukiwania

Opcje przeszukiwania są podobne do tych dostępnych w oknie wyszukiwania.

Z wyjątkiem jednego: zaznacz opcję nieprzetłumaczone aby uruchomić wyszukiwanie i zamianę również w segmentach, które nie zostały jeszcze przetłumaczone.

Aby było to możliwe (chociaż wyszukiwanie i zamiana działa tylko na pamięci), OmegaT skopiuje segment źródłowy do segmentu docelowego przed wykonaniem operacji zamiany. Jeżeli w danym segmencie nie nastąpi zmiana, segment docelowy zostanie „opróżniony”, czyli pozostanie nieprzetłumaczony.

5. Dopasowanie

Narzędzie dopasowania ma za zadanie utworzeniu dwujęzycznej pamięci tłumaczeniowej z jednojęzycznych dokumentów, które zostały już przetłumaczone.

Aby uzyskać dostęp do tego okna, wybieramy NarzędziaDopasowanie plików...

5.1. Krok 1: ustaw parametry dopasowania

Jeżeli chcemy poprawić dopasowanie, spróbujmy zmienić parametry. W większości przypadków im mniejszy przeciętny wynik tym lepsze dopasowanie.

W trybie Heapwise teksty są oceniane globalnie. W trybie Parsewise są oceniane dla każdego segmentu.

Użyj trybu porównywania identyfikatorów ID, aby dopasować tekst zgodnie z zasadą klucz=wartość. Ten system działa, nawet jeżeli klucze w dwóch plikach nie są w tej samej kolejności, i alternatywnie, jeżeli dwa pliki nie zawierają takiej samej ilości informacji. Ta opcja jest wyświetlana tylko wtedy, kiedy oba wybrane pliki są rozpoznawane jako pliki typu klucz=wartość.

Algorytmy Viterbi i Forward-Backward to dwie różne metody obliczeniowe. Wybieramy ten, który daje najlepsze rezultaty.

Klikamy Kontynuuj aby przejść do następnego kroku.

5.2. Krok 2: Wprowadź ręczne poprawki

Proces automatycznego przetworzenia dopasowania dwóch plików zwykle wymaga ręcznych poprawek.

Jednostki tłumaczeniowe znajdują się w komórkach, w ostatnich dwóch kolumnach.

Aby dopasować dwa segmenty w tym samym rzędzie:

  1. Wybieramy pierwszy segment.

  2. Naciskamy spację (skrót do EdycjaDopasuj precyzyjnie).

  3. Klikamy tłumaczenie odpowiadające pierwszemu segmentowi w drugiej kolumnie.

Po kilkukrotnym wykonaniu tej czynności wybieramy EdycjaPonownie dopasuj oczekujące, aby zaktualizować dopasowanie pozostałych segmentów.

Aby zmienić położenie jednego lub więcej segmentów indywidualnie, wybieramy segment (segmenty) i naciskamy U (przesuń w górę) lub D (przesuń w dół).

Po utworzeniu bazy tłumaczeń uwzględnione zostaną tylko wiersze z opcją „zachowaj”, zaznaczone w pierwszej kolumnie.

Jeżeli uznamy, że dwie kolumny są wystarczająco dopasowane, naciskamy przycisk Zapisz TMX..., aby utworzyć wynikową pamięć tłumaczeniową.

6. Skrypty

To okno dialogowe można otworzyć, wybierając NarzędziaSkrypty...

6.1. Zastosowanie

Okno skrypty umożliwia załadowanie istniejącego skryptu do obszaru tekstowego i uruchomienie go w odniesieniu do aktualnie otwartego projektu. Aby dostosować możliwości skryptów, wykonajmy następujące kroki:

  • Załaduj skrypt do edytora, klikając jego nazwę na liście w lewym panelu.

  • Klikamy prawym przyciskiem myszy przycisk od <1> do <12> u dołu panelu i wybierając opcję Dodaj skrypt.

  • Kliknięcie lewym przyciskiem myszy na wybrany numer - uruchomi skrypt. Wybrane makra można uruchomić z menu głównego poprzez elementy w menu Narzędzia lub naciskając kombinację klawiszy Ctrl+Alt+F# (# 1 do 12).

Domyślnie skrypty są przechowywane w katalogu /scripts znajdującym się w katalogu głównym programu OmegaT (tym, w którym znajduje się plik OmegaT.jar).

Jeżeli dodamy nowe skrypty do tego katalogu pojawią się one na liście wyboru w oknie skryptów.

Niektóre dodatkowe skrypty można znaleźć tutaj: skrypty OmegaT.

6.2. Języki skryptowe

W programie OmegaT zaimplementowano następujące języki skryptowe:

  • Groovy (http://groovy.codehaus.org): to dynamiczny język dla wirtualnej maszyny Java. Opiera się na mocnych stronach języka Java, uzupełniony o dodatkowe funkcje inspirowane takimi językami, jak: Python, Ruby i Smalltalk.

  • JavaScript (czasami w skrócie JS, nie mylić z Javą): jest opartym na prototypach językiem skryptowym, który jest dynamiczny, słabo typizowany i posiada pierwszorzędne funkcje. Jest to język wieloparadygmatyczny, wspierający zorientowane obiektowo, imperatywne i funkcjonalne style programowania. Będąc językiem stojącym za popularnym oprogramowaniem, takim jak Firefox, jest znanym i preferowanym narzędziem programistycznym w dziedzinie otwartoźródłowego oprogramowania.

Wszystkie języki mają dostęp do modelu obiektów OmegaT, z projektem jako najwyższym obiektem. Przykładowo następujący fragment kodu napisany w języku Groovy przeprowadza analizę wszystkich segmentów, we wszystkich plikach aktywnego projektu, jeżeli tłumaczenie istnieje, zwraca początkowy i końcowy tekst segmentu:

    files = project.projectFiles;
    for (i in 0 ..< files.size())
    {
        for (j in 0 ..< files[i].entries.size())
        {
            currSegment = files[i].entries[j];
            if (project.getTranslationInfo(currSegment))
            {
                source = currSegment.getSrcText();
                target = project.getTranslationInfo(currSegment).translation;
                console.println(source + " >>>> " + target);
            }
        }
    }

7. Ogólne preferencje

To okno dialogowe jest dostępne po wybraniu opcji OpcjeWłaściwości...

Umożliwia ustawienie parametrów dla wszystkich projektów tłumaczeniowych.

7.1. Ogólne

Użyj klawisza TAB aby przesunąć w przód

Ustaw weryfikację segmentacji klawiszem Tab zamiast domyślnym Enter. Ta opcja jest przydatna w niektórych chińskich, japońskich lub koreańskich systemach wprowadzania znaków.

Zawsze potwierdzaj

Zamykając program wyświetlone zostanie potwierdzenie.

7.2. Tłumaczenie maszynowe

Automatyczne pobieranie tłumaczeń

Ze względu na poufność możemy nie chcieć wysyłać wszystkich segmentów do narzędzia tłumaczenia maszynowego. Po odznaczeniu tej opcji automatyczne tłumaczenia zostaną przywrócone tylko wtedy, gdy w aktywnym segmencie zostanie naciśnięta kombinacja Ctrl+M (Cmd+M w OS X). Następnie musimy ponownie nacisnąć kombinację klawiszy Ctrl + M aby wstawić sugerowane tłumaczenie.

Tylko nieprzetłumaczone segmenty

Zaznaczmy to pole, jeżeli chcemy wysyłać tylko nieprzetłumaczone segmenty do usługi tłumaczenia maszynowego.

Wybierzmy dostawcę z listy i, jeżeli to konieczne, wybierając przycisk Konfiguracja aby wprowadzić dane identyfikacyjne otrzymane od usługodawcy.

Tutaj opisano procedury konfigurowania dostępu do usług Microsoft Translator i Google Translate.

7.3. Glosariusz

Przedstawia opis kontekstowy dla glosariuszy TBX

Odznaczmy tę opcję, jeżeli opis kontekstu wyświetlany dla każdego hasła w glosariuszu jest niepotrzebny lub zbyt długi.

Użyj terminów pojawiających się osobno w tekście źródłowym

Gdy opcja jest zaznaczona, glosariusz pokaże pary lub grupy słów (wyrażeń), nawet jeżeli słowa w nich zawarte występują oddzielnie w tekście źródłowym.

Usuńmy zaznaczenie tej opcji, jeżeli glosariusz wyświetla zbyt wiele fałszywych podpowiedzi.

Użyj form rdzeniowych dla wpisów w glosariuszu

Wybieramy tę opcję, jeżeli chcemy, aby słownik zawierał wyrazy z tym samym rdzeniem.

Zamień podpowiedzi glosariusza podczas wprowadzania tekstu źródłowego

Jeżeli zaznaczona jest zarówno ta, jak i opcja Wstaw tekst źródłowy wszystkie słowa pasujące do wpisu autotekstu zostaną automatycznie przetłumaczone po wprowadzeniu tekstu źródłowego.

Ignoruj ​​wyniki z dużymi rozbieżnościami (np. PIPPO czy foo)

Jeżeli ta opcja jest wybrana, będzie wyświetlany tylko jeden wpis, nawet jeżeli to samo słowo występuje w różnych formach (np. z dużymi literami lub bez nich) w glosariuszu.

7.3.1. Terminologia usługi TaaS

Uzyskanie klucza API

Wybieramy ten przycisk, aby uzyskać dostęp do witryny usługi TaaS i zakładamy konto użytkownika.

Następnie możemy uzyskać klucz dostępu pod adresem: https://term.tilde.com/account/keys/create?system=omegaT.

Przechowuj tylko dla tej sesji

Jeżeli ta opcja jest włączona, program OmegaT nie będzie zapisywał klucza dostępu międzysesyjnego.

Przeglądaj kolekcje usługi TaaS...

Ten przycisk umożliwia przeglądanie istniejących kolekcji usługi TaaS dla języka docelowego i źródłowego projektu, a także umożliwia ich pobranie. Kolekcje prywatne są wytłuszczone. Kolekcje są pobierane w formacie glosariuszy TBX i umieszczane w bieżącym katalogu glosariuszy.

Wybierz domenę wyszukiwania terminologii usługi TaaS...

W razie potrzeby możemy wybrać określoną domenę, aby ograniczyć ilość wysyłanych i pobieranych danych.

7.4. Słownik

Automatycznie sprawdzaj tekst segmentu w słowniku

Odznaczmy opcję automatycznego wyszukiwania - przykładowo, jeżeli dostępne słowniki są zbyt długie.

Użyj dopasowania rozmytego dla wpisów haseł słownikowych

Wybieramy tę opcję, jeżeli chcemy, aby w słowniku były wyświetlane wyrazy zawierające ten sam rdzeń.

7.5. Wygląd

Przywróć okno główne programu

Przywraca komponenty głównego okna programu OmegaT do ich stanu domyślnego. Użyjmy tej funkcji, kiedy został odblokowany, przeniesiony lub ukryty jeden lub więcej elementów programu i nie możemy ich ułożyć tak, jak chcemy. Można również użyć, gdy okna nie pojawiają się zgodnie z oczekiwaniami po aktualizacji programu OmegaT.

7.5.1. Czcionka

Wyświetla okno dialogowe umożliwiające zmianę czcionki wyświetlanego tekstu. Użytkownicy starszych komputerów, którzy uważają, że zmiana rozmiaru okna jest bardzo powolna, mogą spróbować zmienić czcionkę. Przejrzyj ustawienia czcionek w dziale różnorodności

7.5.2. Kolory

Umożliwia wybór różnych kolorów dla każdej części interfejsu użytkownika.

Predefiniowane motywy można ustawić za pomocą skryptów. Skrypt wbudowany w program OmegaT o nazwie „Przełącz motywy kolorów” zapewnia domyślny motyw „ciemny”.

7.6. Filtry plików

To okno dialogowe zawiera listę dostępnych filtrów plików. Filtry używane w bieżącym projekcie są wyróżnione pogrubioną czcionką. Jeżeli nie chcemy używać programu OmegaT do tłumaczenia plików określonego typu, po prostu odznaczamy pole odpowiadające danemu typowi pliku w kolumnie „Włączone”. W takim przypadku OmegaT podczas wczytywania projektów zignoruje tego typu pliki i podczas tworzenia dokumentów docelowych skopiuje je bez wprowadzania zmian. Aby ponownie użyć filtru, wystarczy zaznaczyć pole jego wyboru. Wybierając opcję Domyślnie przywracamy początkowe ustawienia wyboru filtrów plików. Aby zmienić wpływ filtru na pliki i ich kodowanie, wybieramy filtr z listy i klikamy opcję Edytuj.

W oknie dialogowym filtrów plików można włączyć lub wyłączyć następujące opcje:

  • Usuń początkowe i końcowe znaczniki: wyłącz tę opcję, aby wyświetlić wszystkie znaczniki, w tym znaczniki początkowe i końcowe segmentu. Ostrzeżenie: w formatach Microsoft Open XML (docx, xlsx itd.), jeżeli wszystkie znaczniki są wyświetlane, NIE WOLNO wstawiać tekstu przed pierwszym znacznikiem (jest to znacznik techniczny, który zawsze musi rozpoczynać segment).

  • Usuń początkowe i końcowe spacje w projektach niesegmentowanych: domyślnie program OmegaT usuwa początkowe i końcowe spacje. W projektach niesegmentowanych można je zachować odznaczając tę ​​opcję.

  • Zachowaj przestrzenie dla wszystkich znaczników: aktywuj tę opcję, jeżeli dokumenty źródłowe zawierają znaczące przestrzenie używane ze względów kompozycyjnych, których nie należy ignorować.

  • Ignorujmy ​​kontekst pliku podczas identyfikowania segmentów z alternatywnymi tłumaczeniami: domyślnie OmegaT używa nazwy pliku źródłowego jako części identyfikacji alternatywnego tłumaczenia. Jeżeli ta opcja jest zaznaczona, nazwa pliku źródłowego nie będzie używana, a tłumaczenia alternatywne będą obowiązywać w dowolnym pliku, o ile będzie pasował inny kontekst (poprzednie/następne segmenty lub jakiś rodzaj ID w zależności od formatu pliku).

7.6.1. Opcje filtrowania

Kilka filtrów plików (tekstowe, XHTML, HTML, XHTML, OpenDocument, Microsoft Open XML) ma jedną lub więcej określonych opcji. Aby zmodyfikować opcje, wybieramy filtr z listy, klikając na Opcje. Dostępne opcje to:

Pliki tekstowe

  • Segmentacja akapitów według podziałów wierszy, pustych wierszy lub nigdy:

    Jeżeli reguły segmentacji zdań są aktywne, tekst będzie dalej dzielony zgodnie z wybraną tutaj opcją.

Pliki PO

  • Zezwolenie dostępności pustych tłumaczeń w pliku docelowym:

    Jeżeli opcja jest aktywna, tłumaczenie pliku docelowego będzie puste, jeżeli segment PO (który może być całym akapitem) nie zostanie przetłumaczony. Z technicznego punktu widzenia segment msgstr w docelowym pliku PO, jeżeli został utworzony, pozostanie pusty. Ponieważ jest to normalne zachowanie w przypadku plików PO, opcja jest domyślnie włączona. Jeżeli opcja jest wyłączona, tekst źródłowy zostanie skopiowany do segmentu docelowego.

  • Pomiń nagłówek pliku PO

    Nagłówek pliku PO zostanie pominięty i pozostawiony bez zmian, jeżeli ta opcja jest zaznaczona.

  • Automatyczne zastępowanie 'nplurals=INTEGER; plural=EXPRESSION;' w nagłówku.

    Opcja umożliwia programowi OmegaT nadpisanie specyfikacji w nagłówku pliku PO i użycie wartości domyślnej dla wybranego języka docelowego.

Pliki XHTML

  • Następujące atrybuty tłumaczenia: wybrane atrybuty pojawią się jako segmenty w oknie edytora.

  • Rozpocznij nowy akapit: znacznik <br> HTML będzie stanowił akapit do celów segmentacji.

  • Pomiń tekst pasujący do wyrażenia regularnego: tekst pasujący do wyrażenia regularnego zostanie pominięty. Jest wyświetlany na czerwono w weryfikatorze znaczników. Tekst w segmentach źródłowych, który pasuje, jest wyróżniony kursywą.

  • Nie tłumacz atrybutu treści metaznaczników...: metaznaczniki nie zostaną przetłumaczone.

  • Nie tłumacz zawartości znaczników z następującymi parami klucz-wartość atrybutu (oddzielonymi przecinkami): dopasowanie na liście par klucz-wartość spowoduje zignorowanie zawartości znaczników.

    Czasami warto uniemożliwić tłumaczenie niektórych znaczników na podstawie wartości atrybutów. Przykładowo: <div class="hide"> <span translate="no">. Możemy zdefiniować pary klucz-wartość dla znaczników, które mają pozostać nieprzetłumaczone. W powyższym przykładzie pole zawierałoby zapis: class=hide, translate=no .

Pliki Microsoft Office Open XML

Możemy wybrać, które elementy mają zostać przetłumaczone. W tłumaczeniu pojawią się jako oddzielne segmenty.

  • Word: niewidoczny tekst instrukcji, komentarze, przypisy, przypisy końcowe, stopki

  • Excel: komentarze, nazwy arkuszy

  • Power Point: komentarze do slajdów, wzorce slajdów, układy slajdów

  • Globalnie: wykresy, diagramy, rysunki, WordArt

  • Inne opcje:

    • Znaczniki zbiorcze: jeżeli zaznaczone, te bez tekstu do przetłumaczenia między nimi zostaną zebrane w pojedyncze znaczniki.

    • Zachowaj spacje dla wszystkich znaczników: jeżeli zaznaczone, „spacje” (tj. spacje i znaki nowej linii) zostaną zachowane, nawet jeżeli nie zostały ustawione w dokumencie.

Pliki HTML i XHTML

  • Dodaj lub przepisz deklarację kodowania w plikach HTML i XHTML: pliki docelowe mają zestaw znaków kodowania inny niż w pliku źródłowym (bez względu na to, czy jest to jawnie zdefiniowane lub domniemane). Korzystając z tej opcji, tłumacz może określić, czy pliki docelowe mają zawierać deklarację kodowania. Przykładowo, jeżeli filtr plików określa kodowanieUTF8 jako schemat dla plików docelowych, wybranie opcji „Zawsze” zapewni, że ta informacja zostanie uwzględniona w przetłumaczonych plikach.

  • Następujące atrybuty tłumaczenia: wybrane atrybuty pojawią się jako segmenty w oknie edytora.

  • Rozpocznij nowy akapit: znacznik <br> HTML będzie stanowił akapit do celów segmentacji.

  • Pomiń tekst pasujący do wyrażenia regularnego: tekst pasujący do wyrażenia regularnego zostanie pominięty. Jest wyświetlany na czerwono w weryfikatorze znaczników. Tekst w segmentach źródłowych, który pasuje, jest wyróżniony kursywą.

  • Nie tłumacz atrybutu treści metaznaczników...: metaznaczniki nie zostaną przetłumaczone.

  • Nie tłumacz zawartości znaczników z następującymi parami klucz-wartość atrybutu (oddzielonymi przecinkami): dopasowanie na liście par klucz-wartość spowoduje zignorowanie zawartości znaczników.

    Czasami warto uniemożliwić tłumaczenie niektórych znaczników na podstawie wartości atrybutów. Przykładowo: <div class="hide"> <span translate="no">. Możemy zdefiniować pary klucz-wartość dla znaczników, które mają pozostać nieprzetłumaczone. W powyższym przykładzie pole zawierałoby zapis: class=hide, translate=no .

  • W przetłumaczonym dokumencie kompresuj białe znaki: w przetłumaczonym dokumencie wiele ciągłych białych znaków zostanie przekonwertowanych na jedną pojedynczą białą spację.

  • Usuń komentarze HTML w przetłumaczonym dokumencie: skomentowane treści (między <!-- i -->) nie zostaną skopiowane do przetłumaczonego dokumentu.

Pliki Open Document Format (ODF)

  • Możemy wybrać, które z poniższych pozycji mają zostać przetłumaczone:

    wpisy indeksu, zakładki, odnośniki do zakładek, notatki, komentarze, notatki prezentacji, odnośniki (URL), nazwy arkuszy

7.6.2. Edycja filter dialog

To okno dialogowe umożliwia określenie wzorców nazw plików źródłowych, które mają być przetwarzane przez filtr, dostosowanie nazw plików przetłumaczonych i wybranie kodowania, które mają być używane do ładowania pliku i zapisywania jego przetłumaczonego odpowiednika. Aby edytować szablon filtru plików, edytuj pola bezpośrednio lub klikamy opcję Edycja. Aby dodać szablon filtru plików, klikamy opcję Dodaj. To samo okno dialogowe służy do dodawania wzorca lub edycji określonego wzorca. Okno zawiera specjalny edytor szablonów nazw plików docelowych, który umożliwia dostosowanie nazw tworzonych plików.

7.6.2.1. Typ pliku źródłowego, wzorzec nazwy pliku

Kiedy program OmegaT napotyka plik w swoim katalogu źródłowym, próbuje wybrać filtr na podstawie rozszerzenia pliku. Dokładniej, OmegaT próbuje dopasować wzorce nazw plików źródłowych każdego filtru do nazwy pliku. Przykładowo wzorzec *.xhtml pasuje do dowolnego pliku z rozszerzeniem .xhtml. Jeżeli zostanie znaleziony odpowiedni filtr, plik jest przypisywany do niego w celu przetworzenia. Przykładowo filtr XHTML jest używany domyślnie do pracy z plikami z rozszerzeniem .xhtml. Możemy zmienić lub dodać wzorce nazw plików, które mają być obsługiwane przez każdy filtr plików. Wzorce nazw plików źródłowych używają symboli wieloznacznych podobnych do używanych w wyszukiwaniach. Znak „*” oznacza zero lub więcej znaków. Znak „?” odpowiada dokładnie jednemu znakowi. Wszystkie inne znaki reprezentują siebie. Przykładowo, jeżeli chcemy, aby filtr tekstowy obsługiwał pliki (readme, read.me, i readme.txt) powinniśmy użyć wzorca read*.

7.6.2.2. Strona kodowa plików źródłowych i docelowych

Tylko ograniczona liczba formatów plików określa obowiązujące kodowanie językowe. Formaty plików, które nie określają ich kodowania językowego, będą używać kodowania skonfigurowanego dla rozszerzenia pasującego do ich nazwy. Przykładowo, domyślnie pliki .txt będą ładowane przy użyciu domyślnego kodowania systemu operacyjnego. Możemy zmienić kodowanie źródłowe dla każdego wzorca nazwy pliku źródłowego. Pliki docelowe mogą być również zapisane w dowolnym kodowaniu. Domyślnie kodowanie przetłumaczonego pliku jest takie samo, jak kodowanie pliku źródłowego. Źródłowe i docelowe pola kodowania korzystają z menu rozwijanych zawierających wszystkie rozpoznane kodowania. Znacznik <auto> pozostawia wybór kodowania programowi OmegaT. Oto jak to działa:

  • Program OmegaT identyfikuje kodowanie pliku źródłowego za pomocą deklaracji kodowania, jeżeli jest obecna (pliki HTML, pliki oparte na XML).

  • Program OmegaT zaprogramowano, aby używał obowiązującego kodowania dla niektórych formatów plików (właściwości Java itp.).

  • Program OmegaT używa domyślnego kodowania systemu operacyjnego dla plików tekstowych.

7.6.2.3. Nazwa pliku docelowego

Czasami możemy chcieć zmienić nazwy plików, które tłumaczone są automatycznie, przykładowo dodając kod języka po nazwie pliku. Wzorzec nazwy pliku docelowego ma specjalną składnię, więc jeżeli chcemy edytować to pole, musimy wybrać Edytuj... i użyć okna dialogowego Edytuj wzorzec. Jeżeli zamierzamy przywrócić domyślną konfigurację filtru, wybierzmy opcję Domyślnie. Nazwę można również edytować bezpośrednio w polu szablonu nazwy pliku docelowego w oknie dialogowym filtrów plików. Okno dialogowe Edytuj wzorzec zawiera między innymi następujące opcje:

  • Domyślnie jest to ${filename} – pełna nazwa pliku źródłowego z rozszerzeniem: w tym przypadku nazwa przetłumaczonego pliku jest taka sama, jak nazwa pliku źródłowego.

  • ${nameOnly} – pozwala wstawić tylko nazwę pliku źródłowego bez rozszerzenia.

  • ${extension} – oryginalne rozszerzenie pliku.

  • ${targetLocale} – kod lokalizacji docelowej (w postaci „xx_YY”).

  • ${targetLanguage} – język docelowy i kod kraju łącznie (w postaci „XX-YY”).

  • ${targetLanguageCode} – język docelowy - tylko „XX”.

  • ${targetCountryCode} – kraj docelowy - tylko „YY”.

  • ${timestamp-????} – data i godzina systemowa w czasie generowania w różnych wzorcach.

    Przykłady wzorców „SimpleDateFormat” można znaleźć w dokumentacji Oracle.

  • ${system-os-name} – używany system operacyjny komputera.

  • ${system-user-name} – nazwa użytkownika systemu.

  • ${system-host-name} – nazwa hosta systemu.

  • ${file-source-encoding} – kodowanie pliku źródłowego.

  • ${file-target-encoding} – kodowanie pliku docelowego.

  • ${targetLocaleLCID} – docelowe kodowanie Microsoft.

Dostępne są dodatkowe warianty zmiennych: ${nameOnly} i ${Extension}. W przypadku, gdy nazwa pliku ma niejednoznaczną nazwę, można zastosować zmienne w postaci ${name only-extension number} i ${extension-extension number}. Jeżeli przykładowo oryginalny plik nosi nazwę dokument.xx.docx, następujące zmienne dadzą następujące wyniki:

  • ${nameOnly-0} dokument

  • ${nameOnly-1} dokument.xx

  • ${nameOnly-2} dokument.xx.docx

  • ${extension-0} docx

  • ${extension-1} xx.docx

  • ${extension-2} dokument.xx.docx

7.7. Reguły segmentacji

Narzędzia pamięci tłumaczeniowej działają z jednostkami tekstowymi zwanymi segmentami. Program OmegaT posiada dwa sposoby segmentacji tekstu: według akapitu lub według segmentacji zdań (nazywanej również „segmentacją opartą na regułach”). Aby wybrać rodzaj segmentacji, otwieramy ProjektWłaściwości... z menu głównego i zaznaczamy lub odznaczamy odpowiednie pole wyboru. Segmentacja na akapity jest korzystna w niektórych przypadkach, takich jak bardzo kreatywne lub stylistyczne tłumaczenia, w których tłumacz może chcieć zmienić kolejność całych zdań; jednak w przypadku większości projektów preferowanym wyborem jest segmentacja na zdania, ponieważ zapewnia lepsze dopasowania z poprzednich tłumaczeń. Jeżeli została określona segmentacja z podziałem na zdania, możemy wybrać odpowiednie reguły, z menu głównego OpcjeUstawienia segmentacji...

Niezawodne reguły segmentacji są już dostępne dla wielu języków, więc prawdopodobnie nie będziemy musieli zajmować się pisaniem własnych reguł segmentacji. Z drugiej strony ta funkcjonalność może być bardzo przydatna w szczególnych przypadkach, w których można zwiększyć produktywność, dostosowując reguły segmentacji do tekstu tłumaczonego.

Ostrzeżenie: ponieważ tekst będzie inaczej segmentowany po zmianie opcji filtrowania, więc może być konieczne rozpoczęcie tłumaczenia od zera. W tym samym czasie poprzednie ważne segmenty w pamięci tłumaczeniowej projektu zostaną zamienione na segmenty osierocone. Jeżeli zmienimy opcje segmentacji, gdy projekt jest otwarty, musimy ponownie go wczytać, aby zmiany odniosły skutek.

Program OmegaT stosuje następujące sekwencje ustawiania segmentacji:

Struktura poziomu segmentacji

Program OmegaT najpierw analizuje tekst pod kątem segmentacji na poziomie struktury. Podczas tego procesu tylko struktura pliku źródłowego jest używana do tworzenia segmentów.

Przykładowo, pliki tekstowe mogą być dzielone na segmenty w miejscu łamania linii, na pustych liniach lub w ogóle nie być dzielone. Pliki zawierające formatowanie (dokumenty ODF, dokumenty HTML itp.) są segmentowane według znaczników blokowych (akapitów). Przetłumaczalne atrybuty obiektów w plikach XHTML lub HTML można wyodrębnić jako oddzielne segmenty.

Segmentacja na poziomie zdań

Po podzieleniu pliku źródłowego na jednostki strukturalne, OmegaT podzieli te bloki na dalsze zdania.

7.7.1. Reguły segmentacji

Proces segmentacji można zobrazować w następujący sposób: kursor porusza się po tekście, o jeden znak. Przy każdej regule pozycji kursora, składającej się ze wzorców przed i po są stosowane w podanej kolejności, aby sprawdzić, czy którykolwiek z wzorców przed jest poprawny dla tekstu po lewej stronie i odpowiedni wzorzec po dla tekstu po prawej stronie kursora. Jeżeli reguła pasuje, albo kursor przesuwa się dalej bez wstawiania podziału segmentu (dla reguły wyjątku), albo nowy segment jest tworzony w bieżącej pozycji kursora (dla reguły podziału).

Te dwa typy reguł zachowują się w następujący sposób:

Łamanie reguły

Dzieli tekst źródłowy na segmenty. Przykładowo tekst: Did it make sense? I was not sure. - należy podzielić na dwa segmenty. Aby tak się stało, powinna istnieć reguła przerwania dla znaku „?”, po którym następuje spacja i słowo pisane wielką literą. Aby zdefiniować regułę jako regułę łamania, zaznaczmy pole wyboru Przerwij/Wyjątek.

Reguła wyjątku

Pozwala określić, które części tekstu NIE powinny być rozdzielane. Pomimo upływu czasu zapis „Mrs. Dalloway” nie powinien być dzielony na dwa segmenty, dlatego należy ustanowić regułę wyjątku dla wyrazów Mrs (i dla Mr, dla Dr, dla prof itp.), po których występuje kropka. Aby zdefiniować regułę jako wyjątek, pozostawiamy pole wyboru Przerwa/Wyjątek niezaznaczone.

Wstępnie zdefiniowane reguły podziału powinny być wystarczające dla większości języków europejskich i japońskiego. Ze względu na elastyczność możemy rozważyć zdefiniowanie większej liczby reguł wyjątków dla języka źródłowego, aby zapewnić bardziej znaczące i spójne segmenty.

7.7.2. Priorytet reguł

Wszystkie zestawy reguł segmentacji dla pasującego wzorca językowego są aktywne i stosowane w określonej kolejności, dlatego też reguły dla określonego języka powinny być wyższe niż domyślne. Przykładowo reguły dla języka francuskiego kanadyjskiego (FR-CA) powinny być ustawione wyżej niż reguły dla języka francuskiego (FR.*) i wyższe niż domyślne (.*). W związku z tym przy tłumaczeniu z języka francuskiego kanadyjskiego najpierw zostaną zastosowane zasady dotyczące języka francuskiego kanadyjskiego, a następnie zasady dotyczące języka francuskiego i na końcu zasady domyślne.

7.7.3. Tworzenie nowych reguł

Zasadniczo należy unikać większych zmian zasad segmentacji, zwłaszcza po ukończeniu pierwszego projektu, jednak korzystne mogą okazać się drobne zmiany, takie jak dodanie uznanego skrótu.

Aby edytować lub rozszerzyć istniejący zestaw reguł, kliknijmy na element w górnej tabeli. Reguły dla tego zestawu pojawią się w dolnej połowie okna.

Aby utworzyć pusty zestaw reguł dla nowego wzorca językowego, kliknijmy na Dodaj w górnej połowie okna dialogowego. Na dole górnej tabeli pojawi się pusta linia (może być konieczne przewinięcie w dół, aby ją zobaczyć). Zmień nazwę zestawu reguł i wzorzec języka na odpowiedni język i jego kod. Składnia wzorca języka jest zgodna ze składnią wyrażeń regularnych. Jeżeli wybrany zestaw reguł obsługuje parę język-kraj, radzimy przenieść go na górę za pomocą przycisku Przesuń w górę.

Dodaj wzorce przed i po. Aby sprawdzić ich składnię i możliwość zastosowania, warto skorzystać z narzędzi, które pozwalają bezpośrednio zobaczyć ich efekt. Przejrzyj rozdział dotyczący wyrażeń regularnych. Dobrym punktem wyjścia zawsze będą istniejące reguły.

7.7.4. Kilka prostych przykładów

Intencja przed po Notatka
Ustaw początek segmentu po kropce („.”), po której następuje spacja, tabulator... \. \s „\.” oznacza okresowość znaku. „\s” oznacza dowolny biały znak (spacja, tabulator, nowa strona itp.)
Nie dziel po wyrazie Mr. Mr\. \s jest to reguła wyjątku, więc pole wyboru reguły nie może być zaznaczone
Ustaw podział po znaku „。” (japońska kropka)   zwróćmy uwagę, że miejsce oznaczające po jest puste
Nie dziel po wyrazach M. Mr. Mrs. i Ms. Mr??s??\. \s Reguła wyjątków - sprawdźmy użycie znaku zapytania (?) w wyrażeniach regularnych

7.8. Autouzupełnienie

Kliknij Glosariusz... aby skonfigurować automatyczne uzupełnianie glosariusza.

Kliknij Autotekst... aby skonfigurować opcje automatycznego uzupełniania tekstu i dodać lub usunąć wpisy.

Kliknij Tablica znaków... aby ustawić opcje automatycznego uzupełniania tablicy znaków.

Autouzupełnianie jest uruchamiane w segmencie docelowym za pomocą skrótu Ctrl+spacja.

Jeżeli opcja automatycznie przedstaw odpowiednie sugestie jest zaznaczona, autouzupełnianie jest uruchamiane automatycznie po wpisaniu pierwszej litery przetłumaczonego hasła z glosariusza lub wpisaniu „<” w przypadku znaczników.

7.9. Sprawdzanie pisowni

Program OmegaT ma wbudowany moduł sprawdzania pisowni oparty na tym używanym w programach Apache OpenOffice, LibreOffice, Firefox i Thunderbird. Dzięki temu jest w stanie korzystać z szerokiej gamy bezpłatnych słowników ortograficznych dostępnych dla tych aplikacji.

7.10. Narzędzia językowe wtyczki wejściowe

Typ usługi

Wybierz lokalizację sprawdzania ustawień językowych

Użycie na twoim komputerze innego weryfikatora języka niż ten dostarczony z programem OmegaT daje możliwość dostosowania reguł weryfikacji.

Reguły

Aktywuj lub dezaktywuj reguły w zależności od tego, czy dotyczą typu tłumaczonego tekstu.

7.11. Zewnętrzne przeszukiwanie

Włącz polecenia specyficzne dla projektu

Program OmegaT domyślnie nie wykonuje poleceń określonych we własnych ustawieniach projektu (plik finder.xml w katalogu omegat), ponieważ mogą one mieć krytyczny wpływ na bezpieczeństwo systemu operacyjnego.

Aktywujmy tę opcję tylko wtedy, gdy jesteśmy pewni tego, co robimy i tylko w przypadku projektów pochodzących z wiarygodnych źródeł.

Priorytet menu kontekstowego:

Umożliwia zmianę kolejności poleceń menu kontekstowego (w tym, które pojawia się po naciśnięciu prawego przycisku myszy). Po ustawieniu wartości w okolicach 100 polecenia będą wyświetlane u góry, a jeżeli ustawimy wartość na około 900, będą wyświetlane u dołu menu.

Aby zmiana zaczęła obowiązywać, należy ponownie uruchomić program OmegaT.

7.12. Edycjaor

Wstaw tekst źródłowy

Możesz automatycznie wstawić tekst źródłowy w pole edycji. Jest to przydatne w przypadku tekstów zawierających wiele znaków towarowych lub innych nazw własnych, które należy pozostawić bez zmian.

Pozostaw pusty segment

OmegaT pozostawia puste pole edycji. Ta opcja umożliwia wprowadzenie tłumaczenia bez konieczności usuwania tekstu źródłowego, oszczędzając tym samym dwa naciśnięcia klawiszy (Ctrl + A i Del). Puste tłumaczenia są teraz dostępne. Są wyświetlane w edytorze jako <puste>. Aby je utworzyć, kliknij prawym przyciskiem myszy w segmencie i wybierz ustaw puste tłumaczenie. Wpis usuń tłumaczenie w tym samym wyskakującym menu umożliwia również usunięcie istniejącego tłumaczenia bieżącego segmentu. Osiągniemy to samo, usuwając segment docelowy i naciskając Enter.

Wstaw najlepsze dopasowanie rozmyte

OmegaT wstawia tłumaczenie ciągu najbardziej podobnego do bieżącego tekstu źródłowego, jeżeli jest powyżej progu podobieństwa, który wybrałeś w tym oknie dialogowym. Prefiks (domyślnie pusty) może być używany do oznaczania tłumaczeń za pomocą dopasowań rozmytych. Jeżeli dodasz przedrostek (na przykład [fuzzy]), możesz później prześledzić te tłumaczenia, aby sprawdzić, czy są poprawne.

Pola wyboru w dolnej połowie okna dialogowego spełniają następujące zadania:

Spróbuj przekonwertować liczby podczas wstawiania dopasowania rozmytego.

Jeżeli ta opcja jest zaznaczona, po wstawieniu dopasowania rozmytego, ręcznie lub automatycznie, OmegaT spróbuje przekonwertować liczby w dopasowaniach rozmytych zgodnie z zawartością tekstu źródłowego. Istnieje kilka ograniczeń:

  • Segment źródłowy i dopasowania rozmyte muszą zawierać tę samą listę liczb.

  • Liczby między dopasowaniami źródłowymi i docelowymi muszą być dokładnie takie same.

  • Uwzględniane są tylko liczby całkowite i zwykłe liczby zmiennoprzecinkowe (kropka jako znak dziesiętny, np. 5.4, ale nie 5,4 lub 54E-01).

Pozwól, aby tłumaczenie było tożsame tekstowi źródłowemu

Dokumenty do tłumaczenia mogą zawierać znaki towarowe, nazwy lub inne nazwy własne, które będą takie same w przetłumaczonych dokumentach. Istnieją dwie strategie dotyczące segmentów zawierających tylko taki niezmienny tekst.

Możesz w ogóle zrezygnować z tłumaczenia takich segmentów. OmegaT zgłosi wtedy te segmenty jako nieprzetłumaczone. Jest to ustawienie domyślne. Alternatywą jest wprowadzenie tłumaczenia identycznego z tekstem źródłowym. OmegaT jest w stanie rozpoznać, że to zostało zrobione. Aby było to możliwe, wybierz tę opcję.

Eksportuj segment do plików tekstowych

Funkcja eksportu tekstu eksportuje dane z bieżącego projektu OmegaT do zwykłych plików tekstowych. Dane są eksportowane po otwarciu segmentu. Pliki pojawiają się w podkatalogu /script w katalogu plików użytkownika OmegaT i obejmują:

  • Treść tekstu źródłowego segmentu (source.txt).

  • Treść tekstu docelowego segmentu (target.txt).

  • Tekst podświetlony przez użytkownika po naciśnięciu klawiszy Ctrl+Shift+C lub wybraniu opcji Edycja → Eksportuj zaznaczenie (selection.txt).

Zawartość plików jest nadpisywana podczas otwierania nowego segmentu (source.txt i target.txt) lub przy eksportowaniu nowego zaznaczenia (selection.txt). Pliki są niesformatowanymi zwykłymi plikami tekstowymi. Cały proces może być sterowany i kontrolowany za pomocą skryptów opartych na Tck/Tcl. Szczegółowe informacje, przykłady i sugestie można znaleźć w sekcji Korzystanie z funkcji eksportu tekstu w OmegaT.

Przechodzi do następnego nieprzetłumaczonego segmentu i zatrzymuje się, gdy istnieje co najmniej jedno alternatywne tłumaczenie.

Jeżeli chcemy uniknąć błędnych tłumaczeń w przypadku segmentów z kilkoma możliwymi wersjami docelowymi, zaznaczenie tego pola wyboru spowoduje zatrzymanie Przejdź do następnego nieprzetłumaczonego segmentu na następnym takim segmencie, niezależnie od tego, czy został już przetłumaczony, czy nie.

Zezwól na edycję znaczników.

Odznacz tę opcję, aby zapobiec uszkodzeniu znaczników (tj. częściowemu usunięciu) podczas edycji. Usunięcie całego znacznika jest w tym przypadku możliwe, używając Ctrl+Backspace/Delete lub wybierając go całkowicie (Ctrl+Shift+Strzałka Lewo/Prawo), a następnie usuwając go za pomocą (Delete lub Ctrl+X).

Weryfikacja znaczników przy opuszczaniu segmentu.

Zaznacz tę opcję, aby otrzymywać ostrzeżenia o różnicach między znacznikami segmentów źródłowych i docelowych za każdym razem, gdy opuszczasz segment.

Zapisz stan uzupełnienia automatycznego.

Zaznacz tę opcję, aby zapisać w pliku project_save.tmx informację, że segment został automatycznie wypełniony, aby można go było wyświetlić w edytorze z określonym kolorem (jeżeli opcja „oznacz automatycznie uzupełnione segmenty” w menu widok, sprawdzone).

Wstępnie uruchom wielu segmentów.

Domyślnie edytor wyświetla 2000 początkowych segmentów i stopniowo wczytuje więcej, w miarę przewijania w górę lub w dół. Jeżeli masz mocny komputer i/lub jeżeli nie podoba ci się zachowanie paska przewijania podczas ładowania progresywnego, możesz zwiększyć tę liczbę.

7.13. Przetwarzanie znaczników

Podczas tłumaczenia plików związanych z oprogramowaniem umożliwia konfigurację opcji weryfikacji znaczników również do sterowania zmiennymi programowymi (% ...). Możemy także zdefiniować różne opcje związane z weryfikacją znaczników i ustawić niestandardowe znaczniki.

Przykładowo, jeżeli wpiszemy \d+ w polu wyrażenia regularne dla niestandardowych znaczników wszystkie liczby zostaną uznane za znaczniki, co pozwoli na sprawdzenie, czy liczby nie zostały przypadkowo zmienione podczas tłumaczenia.

Podobnie, wyrażenie <.*?> zapewni, że znaczniki HTML, na przykład wstawione w tekście źródłowym, zostaną zachowane bez zmian w tłumaczeniu.

Zauważ, że te dwie instrukcje można łączyć pisząc (<.*?>)|(\d+).

7.14. Zespół

Wpisz tutaj swoje imię i nazwisko, aby było ono dołączone do wszystkich przetłumaczonych przez Ciebie segmentów.

7.14.1. Uwierzytelnienie repozytoriów

Lista projektów, których dane logowania są przechowywane w programie OmegaT. Usuń projekt z tej listy, jeżeli chcesz, aby program OmegaT pytał o dane logowania za każdym razem, gdy projekt jest otwierany.

7.15. Dopasowanie TM

Sortuj zgodne z regułami dopasowań rozmytych:

Domyślnie najbliższe dopasowania wyświetlane w panelu dopasowań rozmytych są określane przez rozpoznawanie rdzenia wyrazu.

Aby uzyskać bardziej dosłowne i bliskie 100% dopasowania, należy wybrać opcję cały tekst, w tym znaczniki i liczby.

Wyświetlanie znaczników pamięci tłumaczeniowych TMX innych programów CAT niż OmegaT

Pozwala zdecydować, które zewnętrzne pliki TMX (np. te, które nie zostały wygenerowane przez OmegaT) mają być przetwarzane.

Dopasowany model wyświetlania

Istnieje możliwość zmiany typu wyświetlania dopasowań rozmytych, poprzez użycie wstępnie skonfigurowanych zmiennych:

Tabela 3.1. Match pane setup

${id} Numer dopasowania od 1 do 5.
${sourceText} Tekst źródłowy dopasowania.
${targetText} Docelowy tekst dopasowania.
${diff} Łańcuch pokazujący różnice między źródłem a dopasowaniem, Wskazówka: użyj tego, jeżeli tłumaczony tekst został zaktualizowany.
${diffReversed} To samo co ${diff}, ale z różnicami (co ma zostać wstawione i usunięte) odwróconymi.
${score} Wartość procentowa obliczona z opcją rdzeniowego dopasowania tekstu, bez znaczników i bez liczb.
${noStemScore} Wartość procentowa obliczona z opcją bez znaczników i bez liczb.
${adjustedScore} Wartość procentowa obliczona z opcją cały tekst, w tym znaczniki i liczby.
${fuzzyFlag} Wskazuje, że to dopasowanie jest rozmyte (obecnie tylko dla tłumaczeń z plików PO ze znacznikiem #fuzzy).

7.16. Widok

Zawiera opcje wyświetlania tekstów i informacje o sposobach różnych modyfikacji programu.

Uwzględnij pierwszy nieunikalny segment, wyróżniając nieunikalne segmenty

Wybieramy tę opcję, aby wyświetlić kolorem szarym wszystkie nieunikalne segmenty (powtórzenia). Gdy ta opcja jest wyłączona, wszystkie nieunikalne segmenty są wyświetlane w kolorze szarym, z wyjątkiem pierwszego wystąpienia.

7.17. Zapisz i przetwórz

Pozwala użytkownikowi wybrać interwał - w minutach i sekundach - pomiędzy kolejnymi automatycznymi okresami zapisu projektu.

Zmień domyślny interwał (3 minuty) zgodnie z wymaganiami projektu:

  • krótkie interwały (minimum 10 sekund) dla projektów synchronizowanych na serwerze wewnętrznym.

  • długie okresy w przypadku projektów zespołowych hostowanych na serwerach zewnętrznych.

Zewnętrzne polecenie przetwarzania końcowego

Określ polecenia do uruchomienia wywołania Utwórz dokumenty docelowe.

Przykładem wykorzystania tej funkcji może być wysyłanie przetłumaczonych dokumentów na serwer FTP klienta.

Uwzględniaj też zewnętrzne polecenia za pośrednictwem projektu

Program OmegaT domyślnie nie wykonuje specyficznych poleceń określonych w ustawieniach projektu (w pliku omegat.project, ponieważ mogą one mieć krytyczny wpływ na bezpieczeństwo systemu operacyjnego.

Aktywujmy tę opcję tylko wtedy, gdy jesteśmy pewni tego, co robimy i tylko w przypadku projektów pochodzących z wiarygodnych źródeł.

7.18. Logowanie przez proxy

Jeżeli program OmegaT musi korzystać z uwierzytelnionego serwera proxy, aby uzyskać dostęp do Internetu, wprowadź tutaj dane podane przez administratora sieci.

7.19. Bezpieczeństwo danych

W tym oknie można przedefiniować hasło główne używane do ochrony szczegółów uwierzytelniania i kluczy dostępu do usług tłumaczenia maszynowego. Zanotujmy wszystkie szczegóły przed utworzeniem nowego hasła, ponieważ zostaną one usunięte i będziemy musieli je ponownie wprowadzić.

7.20. Wtyczki

Umożliwia dostęp do listy dostępnych wtyczek. Wtyczki są instalowane w katalogu /plugins.

7.21. Aktualizacje

Umożliwia automatyczne powiadomienia o aktualizacjach programu OmegaT.