Smyrna 0.3 (18 MB)
Funkcjonalność programu
- Pozwala łatwo tworzyć własne korpusy
- Stworzenie korpusu przeszukiwalnego w Smyrnie sprowadza się do kilku kliknięć: wystarczy wskazać katalog z dokumentami.
- Obsługuje format HTML
- Dzięki temu można łatwo przeszukiwać teksty ściągnięte z zasobów WWW.
- Obsługuje korpusy z metadanymi
- Możesz dodać do swojego korpusu przeszukiwalne informacje o dokumentach.
- Prosta w użyciu
- Smyrna została zaprojektowana z myślą o prostocie. Zawiera niewiele opcji i łatwo jej się nauczyć w kilka chwil.
- Obsługuje duże korpusy
- Setki tysięcy dokumentów, setki milionów słów — to nie problem.
- Jeden korpus, jeden plik
- Smyrna kompiluje wszystkie dokumenty w korpusie do jednego pliku, który można w prosty sposób udostępnić innym osobom.
- Łatwy język zapytań
- Wpisz frazę, aby zobaczyć wszystkie jej wystąpienia.
- Działa na wszystkich platformach
- Program działa pod Windows, Linuksem i Mac OS X: wszędzie, gdzie jest dostępna Java i nowoczesna przeglądarka internetowa.
- Analiza morfologiczna na bieżąco
- Analizator morfologiczny Morfologik jest wykorzystywany do analizy tekstów podczas indeksowania korpusu.
- Chmury słów
- Wizualizacja fragmentów korpusu w postaci chmury słów — jednym kliknięciem.
- Listy frekwencyjne
- Łatwo można zobaczyć, które leksemy są najczęstsze, a które najrzadsze w badanym korpusie.
- Dostęp przez przeglądarkę
- Smyrnę obsługuje się przez przeglądarkę internetową. Dzięki temu dokumenty pokazywane są w ich oryginalnej postaci. Można też działający program udostępnić do użytku innym komputerom w sieci.
Instrukcja obsługi
Instrukcja obsługi Smyrny znajduje się pod adresem:
http://smyrna.danieljanus.pl/manual
Lista dyskusyjna
Uwagi na temat Smyrny i raporty o błędach można wysyłać na listę dyskusyjną smyrna-users. Przed zgłoszeniem błędu warto upewnić się, czy ten błąd nie jest już znany, zaglądając do systemu śledzenia błędów Smyrny.
Kod źródłowy
Smyrna jest napisana w Clojure i ClojureScripcie. Jest wolnym oprogramowaniem udostępnianym na licencji MIT.
Kod źródłowy Smyrny można pobrać z repozytorium GitHub.
Do pobrania
Bieżąca wersja programu
- Smyrna 0.3 (18 MB)
Przykładowe korpusy
- Korpus serwisu piekielni.pl (21 462 dokumenty, 17 MB)
Poprzednie wersje programu
- Smyrna 0.2 (8 MB)
- Smyrna 0.1 (8 MB)
Historia wersji
Smyrna 0.3 (6 marca 2017)
Jest to wersja przepisana od zera, zawierająca wiele usprawnień. Oto najważniejsze:
- Obsługa korpusów z metadanymi.
- Nowy binarny format korpusu i obsługa dużych korpusów.
- Wyszukiwanie fraz składających się z więcej niż jednego słowa.
- Generowanie chmur słów.
Smyrna 0.2 (20 sierpnia 2011)
- Możliwość pobrania listy frekwencyjnej w formacie CSV.
- Możliwość łatwego przeindeksowania korpusu (np. po dodaniu nowego pliku). Po prostu kliknij „odśwież” na liście korpusów.
- Aktualizacja analizatora morfologicznego do wersji 1.8.1.
- Słowa występujące w arkuszach stylów nie są teraz indeksowane. (Dziękuję Markowi Maziarzowi za zgłoszenie problemu.)
Smyrna 0.1 (11 lutego 2011)
- Pierwsza publicznie dostępna wersja.