SSoL 2012: lecture abstracts

Sandra Birzer: When constructions meet statistics: assessing linguistic data with collostructional analysis

Over the last years, not least due to the rise of Construction Grammar, constructions have ever more moved into the linguistic focus. Every construction opens one or more slots to be filled by lexical elements. Which lexical elements are attracted to a construction and how to measure the degree of attraction is a pivotal question. Collostructional Analysis is a freeware statistical script (developed by Stefan Th. Gries and Anatol Stefanowitsch) that allows to measure the degree of lexical attraction on the basis of corpus data. On the basis of Slavonic language data, this class will give a survey of

• the linguistic and statistic assumptions that stand behind Collostructional Analysis;

• the construction types that can be analyzed with the help of Collostructional Analysis;

• how to prepare corpus data for Collostructional Analysis.

Sandra Birzer: Verba dicendi and discourse: a collostructional analysis

In many Slavonic languages verba dicendi figure in discourse structuring elements (DSEs) of the constructional type ADV + (ADVERBIAL) PARTICIPLE, such as RUS čestno govorja, POL szczerze mówiąc, CZ upřímně řečeno ‘frankly speaking’ or RUS inače govorja, POL inaczej mówiąc, CZ jinak řečeno ‘in other words’. Depending on the adverb, the construction has different functions: whereas the first set of collocations expresses speaker’s stance, the members of the second one function as reformulation markers. The range of adverbs that can be inserted into this construction is rather extensive, which gives rise to the question of core and periphery within this class of expressions. We will use collocational strength (calculated with the help of Collostructional Analysis) to answer this question.

Furthermore, the (adverbial) participle is also used in the contextualizing construction (ADVERBIAL) PARTICIPLE + ADV.INSTR + language.INSTR, such as RUS govorja sovremennym jazykom or POL mówiąc współczesnym jezykiem ‘speaking in today’s language’, and the quotative construction (ADVERBIAL) PARTICIPLE + language.INSTR + NOUN.GEN, such as RUS govorja jazykom Dostoevskogo or POL mówiąc jezykiem Mickiewicza ‘using (lit. speaking) Dostoevsky’s / Mickiewicz’s wording (lit. language)’.

Whether the described constructions are the outcome of a grammaticalization or lexicalization process has not been explored in detail so far. Quite interestingly, the ADV + (ADVERBIAL) PARTICIPLE construction displays a very uneven distribution of collostructional strength across its adverbial collexemes, that is accompanied by the usage of near-synonyma (e.g. RUS čestno / otkrovenno govorja ‘frankly speaking’; prošče / uproščenno govorja ‘in plain words’). The distribution of collostructional strength across the adjectival collexemes of the (ADVERBIAL) PARTICIPLE + ADV.INSTR + language.INSTR construction is also uneven, although to a lesser than extent. In our eyes, this behavior is indicative for a lexicalization process and allows to distinguish core (collexemes with high collostructional strength) and periphery (low collostructional strength). On the other hand, the collostructional strength is very low for all collexemes of the (ADVERBIAL) PARTICIPLE + language.INSTR + NOUN.GEN construction. The usage of near-synonyma has not been observed as well. Quotative as a subcategory of evidentiality is rather grammatical. Therefore, the homogeneity of collocational strength for the collocates of one construction might be an indicator for lexicalization and pragmaticalization processes (low homogeneity) and grammaticalization processes (high homogeneity).

Radek Čech: Kvantitativní analýza tematické koncentrace textu

Workshop je zaměřen na představení metody, jejímž prostřednictvím lze analyzovat tzv. tematickou koncentraci textu. Tato metoda umožňuje nejen identifikovat hlavní témata textu, ale i kvantifikovat a) tematickou “váhu” jazykových jednotek vyjadřujících tato témata a b) tematickou koncentraci celého textu. Díky kvantifikaci je možné porovnávat rozdíly mezi hodnotami tematické koncentrace jednotlivých textů (případně skupin textů) za pomoci statistických testů. V úvodní části workshopu budou představeny základní charakteristiky kvantitativní lingvistiky a podrobně popsán metodologický postup analýzy tematické koncentrace (včetně statistického testu). V další části bude prezentován způsob, jak z Českého národního korpusu získat frekvenční distribuce jednotlivých lemmatizovaných textů, které jsou nezbytné pro analýzu tematické koncentrace (pro účastníky kurzu je zajištěno heslo pro plný přístup do ČNK). Následně sami účastníci provedou analýzy tematické koncentrace a budou testovat rozdíly mezi texty.

Pro účast na workshopu není nutná žádná předběžná znalost matematiky či statistky, stejně jako není nutná ani znalost práce s Českým národním korpusem. Jedinou podmínkou aktivní účasti na workshopu je nutnost mít vlastní počítač (připojení k internetu bude zajištěno).

Daniel Frynta: Evoluce jazyků: využití fylogenetických metod

V posledním desetiletí byla v prestižních časopisech publikována řada prací o evoluci a klasifikaci jazyků využívajících fylogenetický přístup, původně převzatý z evoluční biologie. Metodologickým východiskem těchto prací je kladistika, která větvení kladogramu hledá pomocí maximální parsimonie (MP) a nikoli na základě podobnosti jako dříve používané fenetické metody, které jsou vlastně jen variantami shlukové analýzy (Cluster Analysis). Dnes jsou používány i další odvozené fylogenetické metody (ML – maximum likelihood, Bayesovské). Přednáška shrnuje principy a historii použití fylogenetických metod pro analýzu matic lexi kálních i gramatických znaků (předpokládaných homologií). Příklady jsou voleny zejména z publikovaných analýz jazyků indo-evropských, bantuských, austronéských a afro-asijských. Diskutovány budou dosavadní přínosy i perspektivy použití fylogentických metod pro historické analýzy kulturně přenášených znaků.

Jan Chromý: Protetické /v/ v současné pražské češtině

Přednáška představuje výzkum toho, jak funguje protetické /v/ v současné češtině pražských mluvčích mezi 20 a 30 lety. Výzkum byl uskutečněn v první polovině roku 2012 a metodologicky vychází z variační sociolingvistiky. Analyzován je vliv faktorů jako typ, délka a frekvence slova, jeho přejatost, pohlaví mluvčího a idiolekt mluvčího na užití či neužití /v/.

Jiří Janák: Vliv klimatických změn na písmo a náboženství starého Egypta

Přednáška je zaměřena na egyptské výrazy ach (zesnulý, kouzelná moc) a ba (velikost, moc, božství, ‚duše‘) zapisovanými znaky ibise skalního a čápa sedlatého. Na základě zkoumání charakteristiky a životního prostředí těchto živočišných druhů budou přiblíženy některé dosud nejasné pojmy a představy náboženství starého Egypta. Paleografická studie věnovaná příslušným hieroglyfickým znakům odhalí výkyvy v přítomnosti zmíněných ptáků v Egyptě v období od 3. do 1. tisíciletí př. Kr.

Jiří Janák: Těla ze zlata: obrazové popisy staroegyptských bohů

Přednáška se věnuje egyptskému způsobu zobrazování božstev, vytváření jednotlivých ikonografických motivů a důvodům pro jejich zapracování do podob jednotlivých bohů. Jako výjimečný případ, dobře odhalující zásady pro vypracovávání obrazů božstev, bude uvedena změna zobrazování a ikonografie v době amarnské náboženské reformy.

Grzegorz Krajewski: The introduction to the usage-based approach to language acquisition

In this talk, I will introduce the basics of the usage-based approach to language acquisition, and to grammatical development in particular. This approach has a lot in common with Cognitive Linguistics and Construction Grammar theories. Viewed from this perspective, acquiring a language means, above anything else, learning from experience, and as such is a gradual process, shaped by general cognitive mechanisms and properties of ambient speech. I will discuss the key assumptions of the approach, together with the main empirical evidence supporting them.

Grzegorz Krajewski: Development of Polish noun inflections from a usage-based perspective

This talk is thought of as a continuation of the general intro to the UB approach. We will look closely at a series of studies investigating, from the usage-based perspective, the development of a relatively complex inflectional system. The idea is to provide an illustration of the general theoretical standpoint, the kind of questions it poses and answers it provides (without brushing off the challenges and problems it still faces though!). At the same time, the students should acquire some familiarity with various methodological issues concerning child language research in general.

Petr Kubiš: Čínské znakové písmo

Přednáška si klade za cíl v krátkosti seznámit posluchače s čínským znakovým písmem a vyvrátit tak zažitá klišé o čínském písmu, která zhusta převládají v povědomí jak laické tak odborné společnosti. V krátkosti si představíme vznik a vývoj čínského písma a dále se pak budeme věnovat typologii, stavbě a poměru znaků vůči čínskému jazyku. Na závěr si ukážeme jakým způsobem jsou znaky řazeny ve slovnících a jak vnitřní struktura znaků pomáhá při jejich vyhledávání.

Ján Mačutek: Kvantitatívna lingvistika

Prednáška je úvodom do kvantitatívnej lingvistike (nie je nutná znalosť matematiky nad úroveň strednej školy). Budú uvedené dôvody v prospech používania matematických modelov v lingvistickom výskume (napr.: exaktnejšie formulácie zákonov, teórií, …; možnosť testovať hypotézy; odvádzanie vzťahov medzi jednotlivými jazykovými zákonmi). Dôraz je kladený na relevantnosť matematického modelovania pre lingvistiku (nejde o “umenie pre umenie”, matematický vzorec, ktorý nemá rozumnú lingvistickú interpretáciu, nie je prínosom). Na príkladoch ilustrujeme synergetickú teóriu jazyka (všetky objekty v jazyku a ich vlastnosti navzájom súvisia a ovplyvňujú sa).

Pavel Machač: A přece se dorozumíme aneb K elegantním i brutálním redukcím v mluvené češtině z hlediska fonetických rysů

Přednáška se soustředí na fonetické, evt. foneticko-fonologické procesy ve spontánní řeči, jejímž charakteristickým rysem bývá silná kumulace nekanonických výslovnostních forem. Jako materiál slouží spontánní projevy, které jsou sice pro rodilého uživatele jazyka bez obtíží srozumitelné, ale jejichž úseky bez opory obsahového kontextu (tedy pouze sekvence hlásek a slabik) tentýž posluchač většinou nedokáže dekódovat na úrovni hlásek a leckdy ani na úrovni počtu „zamýšlených“ slabik. K balancování mluvčího mezi (1) potřebou, aby byl srozumitelný „na první pokus“, a (2) neochotou vydávat více mluvního úsilí, než je za dané situace třeba, přistupujeme z hlediska konceptu fonetických rysů, jejich potenciálnosti a stability, který bude v rámci přednášky představen. Za použití zvukových dokladů bude prezentován návrh typologie artikulačních redukcí se zaměřením např. na nedostatečnou napjatost, nazalitu funkční a koartikulační, nekanonické reprezentace slabičného vrcholu, paralelní artikulaci, de/sonorizaci, elizi segmentů a slabik apod. Otázka do budoucna může znít: které fonetické rysy a do jaké míry musejí zůstat zachovány, aby posluchač adekvátně rekonstruoval „zamýšlené“ znění sdělení a tím jeho obsah? Jinými slovy: co mluvčí musí, aby posluchač mohl.

Václav Jonáš Podlipský: Integrace percepčních vodítek při vnímání řeči: percepce českých samohlásek

Při vnímání řeči dokáže posluchač, většinou bez jakékoli námahy, extrahovat ze zvukového signálu význam. Stále není přesně známo, jak tento proces funguje. Je však zřejmé, že nespočívá pouze v prostém nalezení určitého akustického znaku (např. explozivní šum u [k]) jedinečně zastupujícího určitou lingvistickou kategorii (např. hlásku /k/). Vjem určité hlásky většinou vzniká podvědomou integrací několika takových “percepčních vodítek”, která vstupují do komplikovaných vztahů. Příkladem integrace a vzájemného vyvažování percepčních vodítek může být percepce českých samohlásek, především i-ových a u-ových, které bude věnována druhá část semináře. Kromě vnímání českých samohlásek z hlediska synchronního se zaměříme také na diachronní vývoj českého samohláskového systému a jeho percepce.

Eric Postma: Automatická detekce osobnosti z řečového signálu

We explore the suitability of the log-Gabor method, a speech analysis method inspired by Ezzat, Bouvrie & Poggio (2007), for automatic classification of personality and likability traits in speech. The core idea underlying the log-Gabor method is to treat the spectrogram as an image of spectro-temporal information. The image is transformed into Gabor energy values using the two-dimensional logarithmic Gabor transform, which is a standard feature extraction method in visual texture analysis. The aggregated energy values are mapped onto classes by means of a support vector machine (SVM).

Marie Postma: Nearbitrárnost spojení znaku a označovaného neboli Jak se de Saussure mýlil

Anotace zde.

Marie Postma: Výhody a nevýhody řečové imitace

Phonetic imitation plays an important role in human interaction in that it reflects the closeness of the social bond between two individuals. In earlier research, Wang, Ramsey & Hamilton (2011) found a link between eye gaze and gesture imitation; they argued that eye gaze controls imitation (mimicry) by modulating the connection strength from medial prefrontal cortex (mPFC) to superior temporal sulcus (STS). In our work, we focus on the effect of eye gaze on speech imitation.

Filip Smolík: Statistika v R: první kroky ke zpracování dat

Praktický seminář zaměřený na zvládnutí základních kroků ke zpracování experimentálních dat v systému R. Naučíme se vkládání dat, základní datové operace, základní grafy a deskriptivní statistiky a základní metody regrese a faktoriální analýzy rozptylu. Pro seminář je vhodné mít vlastní laptop s instalací R, instalační balíčky pro Windows naleznete zde: http://cran.r-project.org/bin/windows/base/

Radek Šimík: Aktuální členění věty jako důsledek intermodulární interakce

Přednáška si klade za cíl přiblížit posluchačům základy některých formálně sémantických a pragmatických teorií aktuálního členění věty. Seznámíme se především s pojmem kontextové danosti (givenness) coby se základním kamenem těchto teorií a na příkladu češtiny a angličtiny si ukážeme, jakým způsobem danost ovlivňuje větnou formu – hlavně intonaci a slovosled. Budeme se také ptát, jak je možné, že ryze pragmatická kategorie danosti ovlivňuje evidentně syntaktickou vlastnost jako je slovosled a podíváme se na to, jak slovosled souvisí s intonací.

Kamil Štumpf: Dokumentace dialektální dolní lužické srbštiny v rámci programu DoBeS

Podle odhadů UNESCO zmizí během 21. století pravděpodobně více než polovina z dnešních 6000 jazyků. Program DoBeS – Dokumentation bedrohter Sprachen (dokumentace ohrožených jazyků) byl založen v roce 2000 nadací VolkswagenStiftung s cílem zdokumentovat několik kriticky ohrožených jazyků a dialektů po celém světě. Důkladná dokumentace umožňuje v příznivých podmínkách postupnou revitalizaci jazyka, archivovaný materiál však bude v budoucnu především cenným zdrojem informací o jazykové pestrosti naší doby. Dolní lužická srbština je jedním z nejohroženějších evropských jazyků. V rámci projektu DoBeS vzniká v Lužickosrbském institutu v Chotěbuzi digitální textový korpus dolnolužickosrbských dialektů. Od října 2011 jsou vedeny rozhovory s posledními rodilými mluvčími, získaný zvukový a obrazový materiál je dále zpracováván podle pravidel DoBeS a ukládán do digitálního archivu v Institutu Maxe Plancka v Nijmegenu, později také do Language Archive (Berlin-Brandenburgische Akademie der Wissenschaften). V přednášce bude na příkladě dolní lužické srbštiny představena technologie nasazovaná v projektech DoBeS, bude pojednáno o celkové koordinaci dolnolužickosrbského dokumentačního týmu, o vytváření konvencí pro anotace a o problémech spojených s dokumentací kriticky ohroženého jazyka.

Jullián Villegas: Parallels between musical consonance and speech intelligibility

In this talk, the origins of speech intelligibility and musical consonance are discussed. Physical, perceptual, and cognitive causes of these complex phenomena have been identified and the understanding of their interactions is still a very active topic of research. We will focus on acoustic and psycho-acoustic features of speech and music and present the effect of them on intelligibility and consonance. Particularly, the role of fundamental frequency in both phenomena will be discussed: we will show the effect of scaling the fundamental frequency of voiced regions on objective speech intelligibility. The frequency scaling is driven by maximizing the glimpse proportion, inspired by musical consonance maximization techniques.

Jullián Villegas: The role of speech rate on speech intelligibility

Speech rate has been identified as one of the main differences between speaking styles. Clear speech (or the speech produced by someone who has been asked to speak clearly) and Lombard speech (or speech produced in noisy environments) are more intelligible than other styles (like casual and “normal” speech), and also have a slower speech rate. In this talk, we will discuss the role of speech rate on intelligibility, show how to artificially modify speech rate either by stretching or compressing an utterance or by time-aligning one to another. Rather than discussing the inner mechanisms of the signal processing, we will focus on understanding the differences between the two modalities and how to use existing software applications to modify duration.

Jan Volín: Statistické zpracování dat v empirickém lingvistickém výzkumu

Empirický výzkum v lingvistice je podle současných konvencí obtížné, ne-li nemožné prezentovat bez statistického zhodnocení nálezů. Hypotézy, které se nějak promítnou v nasbíraných datech, můžeme propagovat teprve po zjištění statistické významnosti nalezených rozdílů. Jinými slovy, je potřeba spočítat pravděpodobnost, že výsledek provedené sondy je nenáhodný, že není pouhou vlastností sebraného vzorku a že je tedy možno závěr zobecnit. Pro různé výzkumné situace jsou používány různé statistické metody. Nabízený kurz je koncipován jako úvodní a představí nejčastěji používané testy společně s vysvětlením principů, na nichž jsou založeny. Testy budou demonstrovány na reálných datech, tempo výkladu by mělo vycházet z potřeb posluchačů.

James Wilson: Dialect accommodation and second-dialect acquisition: a general overview

This presentation is an introduction to dialect contact, second-dialect acquisition and the linguistic outcomes of short-term and long-term contact between speakers of mutually intelligible but regionally different varieties of the same “language”. Theories about short- and long-term accommodation, second-dialect acquisition and new dialect formation are discussed and particular attention is paid to the effect of long-term contact in various speech communities. We will focus on why speakers accommodate, in which direction they accommodate, which features of another variety they are likely to acquire or reject and why, patterns, trends and intra-/inter-individual variation in second-dialect acquisition, and “full” versus “partial” accommodation.

James Wilson: Moravians in Bohemia and Bohemians in Moravia: dialect contact in the Czech Republic

This presentation focuses on dialect contact within the Czech Republic and on the linguistic outcomes of prolonged contact between speakers of Common Czech (CC) and Moravian dialects. The hypotheses and rules advanced on the basis of results from dialect contact studies in other speech communities are applied to the Czech language situation, and a hypothesis of long-term accommodation is advanced with respect to the varieties in contact (Standard Czech (SC), CC, Moravian dialects). Particular attention is directed towards a controversial and unsubstantiated dialect contact hypothesis, according to which Moravians who move to Bohemia quickly give up forms of their own dialects and assimilate features of the local vernacular, CC, while Bohemians who migrate to Moravia do not generally acquire features of the local varieties but instead support the spread of Common Czech beyond Bohemia. Results from a variationist study of Moravian students living in Prague are presented, and the linguistic behaviour of Bohemians living in Moravia is discussed.