- Jakże swojsko brzmiące słowo koszmar pochodzi z francuskiego cauchemar.
- Prawidłowa forma to tylny, tylna, tylne, nie tylni, tylnia, tylnie. Kiedy następnym razem zachcesz wysiąść tylnimi drzwiami, przemyśl to dobrze!
- Póki co jest obrzydliwym rusycyzmem i miło jest, kiedy zastąpi się to sformułowanie jakimś pięknym na razie lub tymczasem. Więcej na stronach bardzo ciekawego bloga.
- Ciekawe jest słówko krzta, nad jego etymologią rozmyślają co poniektórzy, pewnie ktoś rozmyślania zakończył?
- Za przeproszeniem. O losie słodki, jakżeż ja nie znoszę tego sformułowania. Jeśli chcesz przekląć – przeklnij, jeśli się wstydzisz i już przepraszasz – nie przeklinaj. Za każde użycie za przeproszeniem masz u mnie -1 punkt.
- Słowo wyborny jest po prostu wyborne. Uwielbiam je. Jest wyborne.
- Dopełniacz – kogo? czego? tchu. Mianownik – kto? co? dech.
- Dopełniacz – kogo? czego? dżdżu. Mianownik – kto? co? deżdż. No, dzisiaj to deszcz. Kto zna inne takie piękne nieregularności?
- Jako młody adept informatyki na pierwszym roku byłem zachwycony wyrazem spermutować.
- Ludyczny to nie jest bardziej uczona forma słowa ludowy. Ludyczny to związany z bawieniem się, grami, zabawami, hulankami!
...czy raczej informanisty, bo przecież: "humor?! co Ty masz wspólnego z humorem?"
poniedziałek, 27 lutego 2012
Przegląd znakomitych słów, odcinek 1
Od stu lat mam na swoim komputerze na pulpicie plik o nazwie Słówka, do którego nawet czasem coś zapisuję, ale raczej tego więcej nie czytam. A warto. Mam tam już niemałą kolekcję wyrazów, które lubię, których nie lubię lub które mnie czegoś nauczyły. W związku z tym prezentuję wnioski z małego wyimka pliku:
środa, 22 lutego 2012
Zabawy ze słownikiem, cz. 2
Po spółgłoskowych poszukiwaniach doszły mnie słuchy, że język polski ma fenomenalnego kandydata na zupełnego rekordzistę, jeśli chodzi o liczbę kolejnych spółgłosek, niestety nieistniejącego w słowniku. Jest to słowo kontrdrgnięcie – polecam spróbować wymówić. Google powiada, że nawet ktoś kiedyś tego słowa użył.
A teraz czas na nowy skrypcik przetwarzający słownik. Tym razem o niebo prostszy, bo rekord do zbadania o wiele banalniejszy. Postanowiłem poszukać słów, które mają najwięcej spółgłosek w stosunku do wszystkich liter (ignoruję słowa z samymi spółgłoskami, żeby nie zachwycić się takimi cudami jak w, z, hmm, pst).
Tradycyjnie to samo zrobiłem dla innych języków.
A teraz czas na nowy skrypcik przetwarzający słownik. Tym razem o niebo prostszy, bo rekord do zbadania o wiele banalniejszy. Postanowiłem poszukać słów, które mają najwięcej spółgłosek w stosunku do wszystkich liter (ignoruję słowa z samymi spółgłoskami, żeby nie zachwycić się takimi cudami jak w, z, hmm, pst).
#!/usr/bin/perl use utf8; use diagnostics -trace; use strict; use warnings FATAL => 'all'; use feature qw(say); sub get_ratio($) { my ($word) = @_; my $consonants = grep { $_ !~ m/[aeiouyąęó]/ } map { substr($word, $_, 1) } 0 .. length($word) - 1; return $consonants / length($word); } binmode(STDOUT, ":utf8"); open (FILE, "<:encoding(UTF-8)", "slowa-pl.txt"); my $record = 0; while (my $line = <FILE>) { $line =~ s/\r?\n//; my $result = get_ratio($line); say "$result: $line" and $record = $result if $result >= $record && $result < 1; }Wyniki nie mniej ciekawe niż poprzednio, bo mamy w naszym języku niebanalne słowa, dla których współczynnik spółgłoski/litery wynosi 8/9:
chrząszcz, chrzęszcz, przechrzt, schińszcz, schlaszcz, schluszcz, schłoszcz, szklarstwRekordzista samogłoskowy jest jeden: oiomie.
Tradycyjnie to samo zrobiłem dla innych języków.
- Spółgłoskowce niemieckie: Borschtsch, Schmartsch, Schwintsch, Zschetzsch, plantschst, schnarchst, schrumpfst
- Spółgłoskowce angielskie: strengths, tsktsking
- Samogłoskowce są nudne, nic bardziej ekscytujące niż audio czy queue się nie znalazło.
Co w następnej edycji Zabaw ze słownikiem? O tym czytelnicy dowiedzą się już niebawem!
poniedziałek, 20 lutego 2012
Och, apostrofie! (apostrofa do apostrofu)
Droga Nadziejo Polskiej Informatyki! Szanowny Obiecujący Dziennikarzu! Wielmożny Umyśle Ścisły! Wiedz, że jeśli przeczytasz ten tekst, a mimo to nadal apostrofy będziesz w obcych wyrazach wsadzał gdzie popadnie, to ja – nadzieja polskiej informatyki, obiecujący dziennikarz i umysł ścisły (małymi literami) – będę Tobą gardził, pomiatał i uważał Cię za liczbę taką, za jaką Miller Ziobrę, a nawet Panasewicz adresata popularnej piosenki. Jeszcze jedno Facebook'a na Facebooku i usuwam ze znajomych.
Żarty żartami, ale pozwolę sobie na trochę przemądrzalstwa. Zasada w gruncie rzeczy jest prosta i mam nadzieję, że da się to od razu zrozumieć. Apostrof nie służy do odmieniania słów obcego pochodzenia, apostrof służy do zgrabnego połączenia końcówki fleksyjnej z wyrazem kończącym się niewymawianą literą. Oczywiście są wyjątki, ale poniższe wskazówki powinny wszystko wyjaśnić:
Żarty żartami, ale pozwolę sobie na trochę przemądrzalstwa. Zasada w gruncie rzeczy jest prosta i mam nadzieję, że da się to od razu zrozumieć. Apostrof nie służy do odmieniania słów obcego pochodzenia, apostrof służy do zgrabnego połączenia końcówki fleksyjnej z wyrazem kończącym się niewymawianą literą. Oczywiście są wyjątki, ale poniższe wskazówki powinny wszystko wyjaśnić:
- Start: mam przed sobą w głowie odmieniony wyraz obcego pochodzenia, np. imię, nazwisko, nazwę firmy, produktu, języka programowania, miejscowości czy czegokolwiek innego.
- Jeśli zwyczajnie czytasz wszystkie litery końcówki wyrazu, to nie ma miejsca na żadne apostrofy. Sprawdzam Facebooka, Twittera, programuję w Perlu, w Pythonie, wspominam Jobsa, uwielbiam Gatesa, słucham Micka Jaggera. Żadnych apostrofów, bo końcówkę tylko doklejamy do wyrazu, w którym czytamy ostatnią literę. Z tejże przyczyny apostrofów nie będzie też przy neologizmach takich jak commitować, checkoutować, supportować. W ogóle staramy się mówić po polsku :)
- To samo, jeśli x zamieniamy na ks: Linuksa, a nie Linux'a, Linuks'a czy Linux-a.
- Jeśli ostatniej litery nie wymawiamy, to przy odmianie wstawiamy apostrof. Dlatego mamy Google'a, Apple'a, Office'a, Skype'a, Exchange'a, iPhone'a. Uwaga, to samo dotyczy narzędnika (z kim? z czym?) i piszemy: Google'em, Apple'em, Office'em, Skype'em, Exchange'em, iPhone'em. To jest pierwsza nieoczywista rzecz do zapamiętania.
Tak samo jest i tu z czasownikami: update'ować, merge'ować.
Czasem trudniej jest np. z francuskimi nazwiskami, zresztą nie każdy zna francuską wymowę. W każdym razie mówimy o Charles'u de Gaulle'u, choć o Charlesie Darwinie. - Jeśli w miejscowniku (o kim? o czym?) i wołaczu powstają nam dziwne formy, to... używamy dziwnych form i nie wciskamy apostrofów. Niezależnie od tego, jak głupio wyglądają wyrazy takie jak Offisie, JavaScripcie, Joysie, trasie (to ostatnie od... trace). A ponieważ głupio wyglądają potwornie, to zmieniamy zdanie, żeby użyć innej formy.
- Przy odmianie skrótowców nie używamy apostrofów, tylko wstawiamy dywiz. Zatem nie IBM'a, tylko IBM-a, nie LaTeX'a, tylko LaTeX-a.
- Jak potraktować literkę y? Jeśli czytamy ją jako j, to apostrofu nie ma: Disneya, Rooneyowi. Jeśli jako i, to apostrof jest – i to jest mały wyjątek, w końcu literę się czyta, choć inaczej. Czyli Debussy'ego, Banksy'emu.
- A na koniec regułka, dzięki znajomości której możecie poczuć się ekspertami. Nazwiska węgierskie zakończone na y są zupełnie wyjątkowe, bo tutaj apostrofów nie ma. Na dodatek kombinacje gy, ny, ly czyta się jako dź, ń, j, więc odmiana jest dziwna: Gyurcsány (Dziurczań) – Gyurcsánya (Dziurczania), Nagy (Nodź) – Nagyowi (Nodziowi). W Tatrach jest schronisko Téryego, nie Téry'ego.
Wszystko jasne? Na pewno! Jeśli nie chce Ci się czytać wszystkiego, to wbij sobie do głowy tylko punkty 2, 4 i 6 :)
Jeśli wytrwałaś/-eś do tej pory, to w ramach chwili wytchnienia polecam jedyny na świecie retoromański zespół hiphopowy. Osób, które zrozumieją tekst tego utworu, jest mniej więcej tyle, co mieszkańców Pruszkowa.
piątek, 17 lutego 2012
Spółgłoskowe poszukiwania
Musi być trochę informatycznie :) Zaczynam cykl postów pt. Zabawy ze słownikiem. Na szczęście nawet jeśli nie znasz Perla, a także jeśli nie masz pojęcia o programowaniu, post ma szansę być ciekawy.
Ktoś kiedyś dawno temu (a na pewno przed zeszłorocznym wyjazdem na żagle) dał mi zagadkę: w jakim polskim słowie występuje najwięcej spółgłosek pod rząd? I to takich spółgłosek, z których każda odpowiada osobnej głosce? Rozwiązaniem miało być słowo bezwzględny. Postanowiłem to jednak zweryfikować. Troszkę zmieniłem założenie, wyszukałem po prostu słowo o największej liczbie spółgłosek, przy czym dwuznaki połączyłem w jedno. W celu wykonania eksperymentu potrzebne są:
Język angielski jest jeszcze dziwniejszy. Rekordziści spółgłoskowi:
Ktoś kiedyś dawno temu (a na pewno przed zeszłorocznym wyjazdem na żagle) dał mi zagadkę: w jakim polskim słowie występuje najwięcej spółgłosek pod rząd? I to takich spółgłosek, z których każda odpowiada osobnej głosce? Rozwiązaniem miało być słowo bezwzględny. Postanowiłem to jednak zweryfikować. Troszkę zmieniłem założenie, wyszukałem po prostu słowo o największej liczbie spółgłosek, przy czym dwuznaki połączyłem w jedno. W celu wykonania eksperymentu potrzebne są:
- lista słów w języku polskim (np. z SJP.pl)
- umiejętność programowania
- 30-45 minut.
#!/usr/bin/perl use utf8; use diagnostics -trace; use strict; use warnings FATAL => 'all'; use feature qw(say); sub get_type($$$) { my ($word, $diphthongs, $i) = @_; if (grep { $_->{index} eq $i } @$diphthongs) { return 'C' #pierwszy znak dwuznaku } elsif (grep { $_->{index} eq $i - 1 } @$diphthongs) { return 'X' #drugi znak dwuznaku } elsif (substr($word, $i, 1) =~ m/[aeiouyąęó]/) { return 'V' #samogłoska } else { return 'C' #spółgłoska } } sub longest_consonant_substring($) { my ($word) = @_; my @doubles = map { { two => substr($word, $_, 2), index => $_ } } 0 .. length($word) - 2; my @diphthongs = grep { $_->{two} =~ m/[scdr]z|d[żź]|ch/ } @doubles; my @types = grep { $_ ne 'X' } map { get_type($word, \@diphthongs, $_) } 0 .. length($word) - 1; my ($record, $current) = (0, 0); foreach (@types) { if ($_ eq 'C') { $current++; $record = $current if $current > $record; } else { $current = 0; } } return $record; } binmode(STDOUT, ":utf8"); open (FILE, "<:encoding(UTF-8)", "slowa-utf8.txt"); my $record = 0; while (my $line = <FILE>) { $line =~ s/\n//; my $result = longest_consonant_substring($line); say "$result: $line" and $record = $result if $result >= $record; }Programik przez chwilę pomełł słownik i wypluł wynik, który potwierdził wynik zagadki, ale dał też wiele nowych ciekawych słów, w których występuje ciąg 5 kolejnych spółgłosek. Voilà, oto lista po ręcznym odfiltrowaniu innych form tych samych wyrazów i ewentualnych wyrazów pochodnych:
angstrem, bezwzględny, kontrchwyt, kontrplan, kontrprojekt, kontrpropaganda, kontrpropozycja, kontrpróba, kontrsztab, kontrświadczenie, nadskrwiański, najpstrokaciej, najwstrętniej, najwzględniej, nawarstwcie, odwarstwcie, postscriptum, pozezdrski, pyzdrski, rozwarstwcie, uwarstwcie, wielowarstwkaPotem przeszukałem jeszcze raz słownik, nie uwzględniając dwuznaków. Wynik: cztery słowa zawierają ciągi 7 kolejnych spółgłosek:
opierzchłszy, rozpierzchłszy, spierzchłszy, zmierzchłszyZ kolei samotnym rekordzistą w liczbie kolejnych samogłosek (5) jest nieauerowski. Nie pytajcie o znaczenie :)
Język angielski jest jeszcze dziwniejszy. Rekordziści spółgłoskowi:
borschts, latchstring, tsktskingRekordziści samogłoskowi:
cooeeing, cooeying, miaouing, queueingSpółgłoski po niemiecku:
Borschtsch, Angstschrei, Harschschnee, Angstschweiß, Angstschwelle, Dirndlschmuck, Dirndlschnaps, Deutschschweiz, Grätschschritt, Gesichtsschmerz, Gesichtsschnitt, Welschschweizer, selbstschließend, selbstschmierend, selbstschreibend, Ehrfurchtsschauer, Gerichtsschreiber, Fastnachtsschlager, Gesichtsschlagader, Unterrichtsschritt, Geschichtsschreiber, Glückwunschschreiben, UnterrichtsschwesterSamogłoski po niemiecku:
Teeeier, zweieiigCzekam na propozycje kolejnych zabaw ze słownikiem!
środa, 15 lutego 2012
Nie posiadam się z radości
Dużo lubienia ze strony P.T. Czytelników, którzy wedle Google'owskich statystyk przyatakowali bloga już z pięciu krajów i sześciu przeglądarek. Będzie trzeba wspiąć się na wyżyny. Żeby zaraz wszyscy nie pouciekali, ogłaszam wszem i wobec, że każdy, kto kiedykolwiek na tym blogu wyśledzi jakikolwiek błąd ortograficzny bądź interpunkcyjny, może się zgłosić po piwo. Literówki oraz teksty autorstwa Google'a i Facebooka się nie liczą :)
Miłego wieczora! (obie formy poprawne, chyba że chodzi o wieczór jako spotkanie, nie samą porę dnia – wtedy tylko wieczoru)
- Błąd językowy na dziś: wszechobecne posiadanie. Ej, ja rozumiem, że słownictwo musi być maksymalnie wysofistykowane tudzież werbalne lansowanie się jest konieczne, ale nie zmienia to faktu, że posiadać może tylko człowiek i to tylko rzecz w miarę namacalną. Nie, telefon nie posiada funkcjonalności (o funkcjonalnościach kiedyś indziej), nie, ja nie posiadam wiedzy na żaden temat. Ludwiku Dorn! Sabo! Nie bójcie się najprostszego pod słońcem słowa mieć!
- Ciekawostka językowa na dziś: samozaprzeczające się synonimy. Krótka podróż po internecie dała mi kilka takich przykładów:
- opodal = nieopodal
- precedensowy = bezprecedensowy
- omal = nieomal
- Ciekawy tekst na dziś:
„Duży Format”, Mie, mi i naszemu kraju, czyli polszczyzna polityczna - Wniosek na dziś: chyba będzie mniej informatycznie, a bardziej językowo. Czasem będzie zupełnie inaczej. Zobaczymy, co tam jutro przyniesie.
Liczę na czytelniczki polonistki, które powinny czuć moralny obowiązek poprawiania mojego mądrzenia, gdy jest mało precyzyjne, albo gdy po prostu okazuję się nadętym bucem :)
Miłego wieczoru!Miłego wieczora! (obie formy poprawne, chyba że chodzi o wieczór jako spotkanie, nie samą porę dnia – wtedy tylko wieczoru)
Siema/elou!
Oto zakładam bloga, nie pierwszy i nie ostatni raz, ale za to porządnie. Na początek podziękowania dla głównego podżegacza, czyli Zbynia, a teraz parę słów gwoli jasności (gwoli - piękne słowo).
Wybitnie jestem uradowany neologizmem, który udało mi się wymyślić na potrzeby tej oto strony. Oto bowiem słowo "humormatyk" chyba zupełnie nieźle określa informatyka z humanistycznym zacięciem i rozbuchanym poczuciem humoru (oraz jeszcze o wiele bardziej rozbuchanym ego). Blog jest dla każdego. Nie narzucam sobie sztywnych ram tematyki, ale będzie to głównie pogranicze programowania i językowego wymądrzania się, czyli to, co robię na co dzień. Notki raczej krótkie, postaram się, aby były dość częste.
A teraz na dobry początek zajrzyj na sidebar (hm, może jednak boczny pasek) i zadaj sobie pytanie tam widoczne. Czy jesteś już członkiem? Bardzo zachęcam do bycia członkiem. Lubić na Facebooku też mnie można, w ten sposób nic nie ucieknie.
Cdn.
KDD aka Dudzio
Wybitnie jestem uradowany neologizmem, który udało mi się wymyślić na potrzeby tej oto strony. Oto bowiem słowo "humormatyk" chyba zupełnie nieźle określa informatyka z humanistycznym zacięciem i rozbuchanym poczuciem humoru (oraz jeszcze o wiele bardziej rozbuchanym ego). Blog jest dla każdego. Nie narzucam sobie sztywnych ram tematyki, ale będzie to głównie pogranicze programowania i językowego wymądrzania się, czyli to, co robię na co dzień. Notki raczej krótkie, postaram się, aby były dość częste.
A teraz na dobry początek zajrzyj na sidebar (hm, może jednak boczny pasek) i zadaj sobie pytanie tam widoczne. Czy jesteś już członkiem? Bardzo zachęcam do bycia członkiem. Lubić na Facebooku też mnie można, w ten sposób nic nie ucieknie.
Cdn.
KDD aka Dudzio
Subskrybuj:
Posty (Atom)