Számítógépes társadalomtudomány - tematikus különszám a Magyar Tudomány legfrissebb számában

"Témacsoportunk erőfeszítéseinek középpontjában a nagy teljesítményű számítástechnikai módszerek társadalomtudományi kutatásokban való felhasználásának elősegítése áll. A Magyar Tudományos Akadémia fő küldetésének megfelelően különös hangsúlyt helyezünk a feltáró jellegű alapkutatásokra. Döntő fontosságúnak tartjuk azonban, hogy ezek kiegészüljenek az alkalmazásra irányuló kutatásokkal, valamint a társadalmi és kutatói felhasználóknak szánt algoritmikus eszköztár fejlesztésével.

Segítségünkre lehet az a szerencsés körülmény, hogy a magyar társadalom-, természet- és adattudományi szakemberek körében már mintegy két évtizedes hagyománya van a számítógépes támogatású társadalomkutatás egyes kérdésköreiben, leginkább a társadalmi hálózatkutatás terén való együttműködésnek. Tapasztalataink szerint ez a laza szálakból fonódó, de folytonos transzdiszciplináris kapcsolat számottevő versenyelőnyt jelent a magyar tudományosságnak a nemzetközi mezőnyben. Előnyünk azonban illanékony. Hogy tartósan megőrizhessük, a kialakult tudományközi hálózat laza kapcsolódásait módszeres együttműködési rendszerré szükséges alakítani, mely egyszersmind jól azonosítható entitásként, elismert szereplőként jelenik meg a nemzetközi tudományosságban is. "
(Péli Gábor-Rudas Tamás: Bevezető)

Az MTA Társadalomtudományi Kutatóközpontja kezdeményezésére 2017 őszén megalakult az MTA Számítógépes Társadalomtudomány (Computational Social Science) témacsoportja. Hivatalos bemutatkozásunkra 2017. november 14-én, a Magyar Tudomány Ünnepe keretében került sor. Tematikus összeállításunkban az akkor elhangzott előadások kibővített és szerkesztett változatai szerepelnek.

A tematikus szám tartalma:

Rudas Tamás, Péli Gábor
BEVEZETŐ

Vámos Tibor
AKADÉMIÁNK ÉS AZ INFORMÁCIÓS VILÁG

Villámnézet az információs világ és akadémiánk viszonyairól, az emberi tényezőkkel kapcsolatos legfontosabb feladatokról és a robotvilágról szóló hisztériákról.

Novák Attila, Siklósi Borbála, Prószéky Gábor
SEGÍTHETNEK-E A SZÓBEÁGYAZÁSI MODELLEK A TÁRSADALOMTUDÓSOKNAK?

A nyelvtechnológiában az utóbbi néhány évben előtérbe kerültek az olyan disztribúcióalapú szójelentés-reprezentációs modellek, amelyek a szavak jelentésének a szűken vett grammatikai és szemantikai dimenzióin túl a tágabb stiláris, illetve szociolektális (csoportnyelvi) dimenzióit is meglepő pontossággal megragadják. Ezért ezek a mesterséges neurális hálózatokon alapuló szóbeágyazási modellek nemcsak a nyelvtechnológusoknak, sőt nem is csak a nyelvészeknek érdekesek, hanem mindazon tudományágak képviselőinek gazdag tudásforrást jelenthetnek, akik számára a szövegek alapvető nyersanyagként szolgálnak.

A társadalomtudósok számára különösen érdekesek lehetnek azok a szövegek, amiket a különféle közösségi oldalak felhasználói vagy akár az online sajtóhírekhez fűzött hozzászólások szerzői generálnak. Rengeteg ilyen szöveg áll rendelkezésre ma már elektronikus formában, és ez lehetővé teszi, hogy jó minőségű modelleket hozzunk létre a korábban említett technológia felhasználásával, és azokat különböző dimenziók mentén kereshetővé tegyük. Ízelítőként bemutatunk néhány példát a modell által megfogható jelenségek köréből.

Ács Judit, Borbély Gábor, Makrai Márton, Nemeskey Dávid, Recski Gábor, Kornai András
HIBRID NYELVTECHNOLÓGIÁK

Az elmúlt harminc év nyelvészetét a „racionalista” (szabályalapú, szimbólumkezelő) és az „empirista” (statisztikai alapú, gépi tanulásos) nyelvészeti modellek harca jellemezte. Míg a nyolcvanas években még egyértelműen a racionalista paradigma volt az uralkodó, mára ez, különösen az utolsó néhány év mélytanulásos forradalmának köszönhetően megfordult, és egyértelműen az empirista paradigma lett a domináns. Az MTA SZTAKI nyelvtechnológiai csoportja elsősorban a hibridizáció kérdéseivel foglalkozik, azzal, hogy miképp találhatjuk meg a diszkrét, szimbolikus struktúrát a folytonos, zajos adatokban, illetve hogyan tudjuk a struktúráról való ismereteinket hatékonyabb algoritmusok építésében kamatoztatni.
 
Galántai Júlia, Pápay Boróka, Kubik Bálint György, Szabó Martina Katalin, Takács Károly
A PLETYKA A TÁRSAS REND SZOLGÁLATÁBAN – AZ INFORMÁLIS KOMMUNIKÁCIÓ STRUKTÚRÁJÁNAK MÉLYEBB MEGÉRTÉSÉÉRT A COMPUTATIONAL SOCIAL SCIENCE ESZKÖZEIVEL

A pletykálás, amelynek során másokról értékelő módon a hátuk mögött beszélünk, az emberi kommunikáció jelentős hányadát teszi ki. Miközben a mindennapi életben pejoratív értelemben beszélünk róla, a társadalomtudományi kutatások arra világítanak rá, hogy a pletykának jelentős szerepe van a társas rend biztosításában, a normák fenntartásában és a kooperáció biztosításában a különböző társas kontextusokban. Miközben ezeket a társadalomtudományi alapkérdéseket eddig főleg kvalitatív, önkitöltős kérdőíves vagy absztrakt kísérleti körülmények között vizsgálták, cikkünkben azt kívánjuk bemutatni, hogy miként gazdagíthatóak ezek a hagyományos elemzési módszerek a computational social science eszköztárának felhasználásával. Leírjuk azt a kvantitatív stratégiát, amellyel elemezzük a pletykát és alaptulajdonságait egy élő, spontán beszédet tartalmazó korpuszban. Bemutatjuk azokat a morfológiai, téma szerinti, szóhasználat szerinti, kontextuális és nem szövegalapú (például időzítés, beszélőváltás, nevetés és más hangok) elemzési lehetőségeket, amelyek a pletyka természetének és funkcióinak mélyebb társadalomtudományi megértését segítik.

Kertész János, Roberta Sinatra, Vedres Balázs
A TÁRSADALOM HÁLÓZATI JELENSÉGEINEK ADATVEZÉRELT VIZSGÁLATA

A CEU Hálózattudományi Központja társadalmilag releváns kérdések adatokon alapuló, hálózati szempontú vizsgálatával foglalkozik. Néhány példa: Milyen az emberi kapcsolatok szerkezete társadalmi méretekben a kommunikációs adatok tükrében, és hogyan változik mindez az új médiumok hatására? Hogyan terjednek a járványok, az információ vagy egy innováció a társadalomban? Hogyan lehet optimalizálni egy team összetételét a kreativitás szempontjából? Mi a nemek szerepe a munkacsoportok hatékonyságában? Hogyan lehet mérni és előre jelezni a sikert? Ebben a cikkben röviden áttekintünk néhány eredményt, amelyeket a társadalmi terjedési jelenségek, a teamek kreativitásának hálózati vonatkozásai és a siker társadalmi elmélete területeit kutatva értünk el.

Lévai Péter, Telcs András
ÚJ MÓDSZEREK RÉGI KÉRDÉSEK MEGVÁLASZOLÁSÁRA AZ AKADÉMIAI FELHŐBEN – HÁLÓZATOK ÉS OKSÁGI KAPCSOLATOK FELDERÍTÉSE A TÁRSADALOMTUDOMÁNYOKBAN

Cikkünkben röviden bemutatjuk, milyen drámai változáson megy keresztül az informatika fejlődésének hatására a kutatók napi munkája. Részletesen kitérünk annak ismertetésére, milyen, eddig soha nem volt lehetőségek nyílnak meg az asztali és a számítógépes felhőben rendelkezésre álló kapacitások révén a társadalomtudományok (és más területek) kutatói előtt. Példaként röviden ismertetjük, hogyan járulhat hozzá az akadémiai felhő, a nagy kapacitású számítógépek alkalmazása a nemzetközi akadémiai tér, illetve rejtett oksági kapcsolatok feltárásához.

Kovács László
ADATKEZELÉS – A (KUTATÁSI) ADATOK KEZELÉSE A MAGYAR TUDOMÁNYOS ÉS MEMÓRIAINTÉZMÉNYEKBEN

Az MTA Könyvtár és Információs Központ, az MTA Társadalomtudományi Kutatóközpont Kutatási Dokumentációs Központja, valamint az MTA Számítástechnikai és Automatizálási Kutatóintézet Kutatási adatok kezelése címmel műhelykonferenciát rendezett 2015. május 14-én. A műhelykonferencia főbb, csak kéziratban rendelkezésre álló megállapításai mentén mutatjuk be a kutatási adatok kezelésének néhány kérdését, a kutatási szféra elmúlt húsz éve adatkezelési gyakorlatának jellemző vonásait. A tudomány és a kulturális örökség szféráiban lévő (memória)intézmények hasonló adatkezelési problémái és gyakorlata miatt megállapításaink többsége a memóriaintézményekre is érvényes lehet.

Simon Eszter, Váradi Tamás
MAGYAR NYELVTECHNOLÓGIAI INFRASTRUKTÚRA A TÁRSADALOMTUDOMÁNYOK SZOLGÁLATÁBAN

Tanulmányunkban bemutatjuk, hogy mivel foglalkozik a nyelvtechnológia, és hogy melyek azok a területek, ahol – jellemzően nagyobb rendszerekbe beépítve – nyelvtechnológiai eszközöket használunk. Ismertetjük az e-magyar szövegfeldolgozó eszközláncot, amelyet hatékonyan tudnak használni a társadalomtudományok területén tevékenykedő kutatók is, illetve bárki, aki magyar nyelvű szöveget szeretne feldolgozni további kutatási céljainak megfelelően. A nyelvtechnológiai fejlesztések használhatóságát három alkalmazás bemutatásával igyekszünk megvilágítani. Hangsúlyozzuk, hogy az MTA Nyelvtudományi Intézet koordinálásával, a HunCLARIN égisze alatt a magyar nyelvtechnológia kész és képes hatékonyan segíteni a társadalomtudományi kutatásokat.

Muraközy Balázs
GÉPI TANULÁS, PREDIKCIÓ ÉS OKSÁG A KÖZGAZDASÁG-TUDOMÁNYBAN

Az empirikus közgazdaság-tudomány módszertanának fókuszában az oksági hatások becslése áll, miközben a gépi tanulás fő erőssége az előrejelzés vagy predikció. Az eltérő célok miatt a két módszertan nem helyettesíti automatikusan egymást. A közelmúlt kutatásai rámutatnak, hogy legalább három területen inkább kiegészítő a két módszer: i) a gépi tanulás adatokat generálhat az oksági elemzés számára; ii) számos közgazdasági kérdés valójában prediktív és nem oksági; iii) az oksági elemzés bizonyos lépései prediktívek.
 
A cikkek teljes szövege elérhető az alábbi oldalon