Słowniki frekwencyjne czyli listy najczęściej występujących słów w danym języku mogą być sprytnym sposobem na opanowanie wymaganego słownictwa, np w języku angielskim.
Jak zapewne zauważyliście, w bioinformatyce zazwyczaj używa się angielskiego, ze względu na ogrom materiałów, stron www i publikacji właśnie w tym języku. Stąd też opanowanie go jest niezbędne, aby móc się ciągle rozwijać w tej pasjonującej dziedzinie nauki..
Najprostszym, podstawowym zbiorem słów jest tzw, OGDEN’s BASIC ENGLISH, będący zbiorem 850 słów podstawowych. Lista ta została rozszerzona później do 1500 a następnie do 2000. Oszacowano, iż nauczenie się listy podstawowej to kwestia 40h, zapewnia ona zrozumienie do 50% tekstów czytanych.
Inną ciekawe zestawienie, zawierające od razu polskie tłumaczenia, jest lista 2000 najczęściej wystepujących słów. Jak autor zapewnia, jest ona najbardziej prawdopodobna, gdyż jest to średnia z wszystkich innych list dostępnych w internecie. Na stronie są też przygotowane dodatkowe materiały w postaci tabelek wspomagających nauczanie i liczne ćwiczenia. 2000 słów to minimum wystarczające do porozumiewania się w języku angielskim.
Jeszcze inną listę, tym razem 3000 słów, prezentuje Oxford University Press. Jako ciakawostka:
- In a typical lower intermediate text close to 100% of the words will be Oxford 3000 keywords.
- In a typical upper intermediate text 90-95% of the words will be Oxford 3000 keywords.
- In a typical advanced text 75-90% of the words will be Oxford 3000 keywords.
Myślę, żę temat jest ciekawy, będę go dalej rozwijać i wrzucę też przykładowy kod w Pythonie do generowania własnych słowników, obejmujących już specjalistyczne słownictwo z konkretnej dziedziny wiedzy.


Najnowsze komentarze