Zasoby językowe i technologia przetwarzania tekstu POLINT-112-SMS jako przykład aplikacji z zakresu bezpieczeństwa publicznego
- Dostępność: dostępny
- ISBN: 978-83-232-2155-5
- Kategoria: OUTLET, Lingwistyka Komputerowa
- Data wydania: 2010
This book is about application of text processing technologies and resources in systems with emulated language competence which aim at the enhancement of public security. The POLINT-112-SMS prototype presented in this study captures text messages about potentially dangerous situations and processes the information they vehicle. Texts in open Polish are supposed to be entered to the system in the form of SMS messages sent by many users. Messages are treated by understanding procedures and information from various users is being integrated with the system's knowledge collected so far. Basic resources developed within the project are presented. The results reported here were obtained within a research project of the Polish Platform of Homeland Security and funded by the Polish Government grant MNiSzW R00 028 02 (2006-2010).
- Przedsłowie
- 1. Wstęp
- 2. Wprowadzenie
- 2.1. Kompetencja językowa
- 2.2. Modelowanie kompetencji językowej - metody empiryczne
- 2.3. Emulowanie kompetencji językowej człowieka - rola użytkownika
CZĘŚĆ I - Aplikacja- 3. Aplikacja POLINT-112-SMS
- 3.1. Model logiczny, załoBenia realizacyjne
- 3.1.1. Potrzeby informacyjne uBytkownika systemu POLINT-112-SMS
- 3.1.2. UBytkownicy systemu
- 3.1.3. Architektura - model logiczny systemu
- 3.2. Moduł NLP. Analiza tekstu wejściowego
- 3.2.1. Model predykatywno-argumentowy
- 3.2.2. Leksykon-gramatyka
- 3.2.3. POLINT - moduły przetwarzania wstępnego
- 3.2.3.1. Moduł Analizy Wstępnej
- 3.2.3.2. Moduł Rozpoznawania Kolokacji
- 3.2.3.3. Moduł Rozpoznawania Nazw
- 3.2.3.4. Moduł Przetwarzania Równoważników Zdań
- 3.2.4. POLINT - parser i analizator semantyczny
- 3.2.4.1. Słownik
- 3.2.4.2. Gramatyka
- 3.2.4.3. Pokrycie językowe parsera
- 3.2.4.4. Analiza
- 3.3. Zarządzanie wiedzą
- 3.3.1. Typy wiedzy przechowywane na róBnych poziomach systemu
- 3.3.2. Struktury danych
- 3.3.3. Ramy: konstruowanie
- 3.3.3.1. Etap 1: Nadawanie znaczenia tokenom
- 3.3.3.2. Etap 2: Tworzenie ram
- 3.3.3.3. Etap 3: Składanie ram
- 3.3.4. Scalanie ram w MUD i MAS
- 3.4. Dialog i wnioskowanie
- 3.4.1. Model dialogu asynchronicznego
- 3.4.1.1. Anafora
- 3.4.1.2. Dopytywanie
- 3.4.1.3. Dopasowywanie odpowiedzi do pytań
- 3.4.1.4. Logowanie
- 3.4.1.5. Komunikaty ZERO
- 3.4.1.6. Wybór interpretacji
- 3.4.1.7. Profile uBytkowników
- 3.4.1.8. Odpowiadanie na pytania uBytkowników i wysyłanie powiadomień
- 3.4.1.9. Postępowanie w przypadku sprzecznych danych
- 3.4.2. Reguły Modułu Analizy Sytuacji
- 3.4.3. Wnioskowanie odnośnie czasu i przestrzeni
- 3.4.3.1. Moduł Czaso-Przestrzenny
- 3.4.3.2. Model XCDC
- 3.4.3.3. Relacje czasowo-przestrzenne
- 3.4.3.4. Relacje względne
- 3.4.3.5. Mapa
- 3.4.3.6. Wnioskowanie
- 3.4.1. Model dialogu asynchronicznego
- 3.5. Panel Centrum Dowodzenia: moduł wizualizacyjny
- 3.5.1. Funkcjonalności modułu wizualizacyjnego
- 3.5.1.1. Przedstawienie mapy obszaru działań
- 3.5.1.2 Interfejs przeglądania danych
- 3.5.2. Funkcjonalności Panelu Centrum Dowodzenia (PCD)
- 3.5.2.1. Kontrola dostępu i autoryzacja uBytkownika
- 3.5.2.2. Tryb wywiadowcy
- 3.5.2.3. Podgląd SMS
- 3.5.2.4. Logi systemowe
- 3.5.2.5. Konfigurowanie systemu POLINT-112-SMS przez PCD
- 3.5.2.6. Rozwiązania technologiczne
- 3.5.1. Funkcjonalności modułu wizualizacyjnego
- 3.6. Realizacja architektury
- 3.6.1. Model implementacyjny
- 3.6.2. Środowisko instalacyjne
- 3.7. Metodologia rozwijania systemów z kompetencją językową
- 3.7.1. Wprowadzenie
- 3.7.2. Iteracyjny nodel budowy systemów z kompetencją językową
- 3.7.2.1. Model podstawowy
- 3.7.2.2. Model rozszerzony z wykorzystaniem eksperymentów kontrolowanych
- 3.7.3. Budowa i testowanie systemu POLINT-112-SMS
- 3.7.3.1. Przygotowanie ?beta? prototypu
- 3.7.3.2. Struktura i zasady doboru zespołów testujących
- 3.7.3.3. Eksperymenty symulacyjne
- 3.1. Model logiczny, załoBenia realizacyjne
CZĘŚĆ II - Zasoby zewnętrzne i rozwijane w projekcie- 4. Zasoby i narzędzia ogólnodostępne wykorzystywane w projekcie
- 4.1. Korpus IPI PAN
- 4.2.Uniwersalny Słownik Języka Polskiego
- 4.3. Generatywny Słownik Czasowników Polskich
- 4.4. Narzędzia do generowania sieci leksykalnych typu WordNet - VisDic i DebVisDic
- 4.5. Słownik internetowy SJP.PL
- 5. Zasoby własne rozwijane w projekcie
- 5.1. Korpusy dialogów
- 5.1.1. SMS-y prywatne
- 5.1.2. SMS-y eksperymentalne
- 5.1.3. Krótkie podsumowanie analizy korpusów
- 5.2. Korpus tekstów prawniczych
- 5.3. Korpus nagrań 997
- 5.3.1. Nagrania z telefonu "997" i ich przetwarzanie
- 5.3.2. Przeglądarka i edytor transkrypcji ETRAN
- 5.4. Słownik kolokacji werbo-nominalnych
- 5.4.1. Charakter oraz struktura kolokacji werbo-nominalnych
- 5.4.2. Zasób początkowy
- 5.4.3. Rozszerzenie zasobu początkowego
- 5.4.3.1. Algorytm rozszerzania słownika kolokacji
- 5.4.3.2 Wyniki zastosowania algorytmu rozszerzania słownika kolokacji
- 5.5. Słownik walencyjny czasowników
- 5.5.1. Kodowanie czasowników
- 5.5.2. Algorytm
- 5.5.3. Wyjściowy format słownika
- 5.5.4. Wyniki stosowania algorytmu
- 5.6. Sieć leksykalna PolNet-Polish WordNet
- 5.6.1. Źródła i narzędzia
- 5.6.2. Algorytm budowy synsetów i tworzenia relacji hiponimii/hiperonimii
- 5.6.3. Charakterystyka ilościowa części rzeczownikowej PolNetu (stan na marzec 2010)
- 5.6.4. Weryfikacja danych sieci PolNet w systemie POLNET-112-SMS
- 5.6.5. Integracja danych sieci PolNet z Global WordNet Grid
- 5.6.6. Rozszerzanie PolNetu na inne części mowy
- 5.6.7. Narzędzie wordnetowe WQuery
- 5.6.7.1. Język zapytańWQuery
- 5.6.7.2. Zastosowania WQuery w systemie POLINT-112-SMS i w ontologii PolNet
- 5.7. POLEX
- 5.7.1. Publicznie dostępne zasoby źródłowe słownika morfologicznego POLEX
- 5.7.2. Rozszerzenie POLEX/PMDB
- 5.1. Korpusy dialogów
DODATEK I : Ogólna ontologia bytów na potrzeby projektu POLINT-112-SMS
DODATEK II : Taksonomia bytów zastosowana a systemie POLINT-112-SMS
DODATEK III Przykładowy zapis rozmowy przy pomocy systemu ELAN
BIBLIOGRAFIA
OBJAŚNIENIA AKRONIMÓW I SKRÓTÓW
O ZESPOLE AUTORSKIM I O KSIĄ[CE
INDEKS NAZWISK
INDEKS RZECZOWY
Informacje szczegółowe | |
---|---|
Wersja publikacji | drukowana |
Format | 17,0 x 24,0 |
Tytuł (EN) | Language resources and text processing technologies. The POLINT-112-SMS system as example of application of Human Language Techology in the public security area |
Typ publikacji | Monografia |
Wydanie | I |
Seria | Lingwistyka Komputerowa nr 6 |
ISSN | 1896-379X |
ISBN | 978-83-232-2155-5 |
Liczba stron | 246 |
Liczba arkuszy wydawniczych | 18,00 |
Rodzaj oprawy | miękka |