Szövegbányászat és mesterséges intelligencia R-ben
2021
Üdvözöljük!
Könyvünk bevezeti az érdeklődőket a szövegbányászat és a mesterséges intelligencia társadalomtudományi alkalmazásának speciális problémáiba. Támaszkodva a Sebők Miklós által szerkesztett Kvantitatív szövegelemzés és szövegbányászat a politikatudományban (L’Harmattan, 2016) című kötet elméleti bevezetésére, ezúttal a társadalomtudományi elemzések során használható kvantitatív szövegelemzés legfontosabb gyakorlati feladatait vesszük sorra.
A szövegek adatként való értelmezése (text as data) és kvantitatív elemzése, avagy a szövegbányászat (text mining) a nemzetközi társadalomtudományi kutatások egyik leggyorsabban fejlődő irányzata. A szövegbányászat emellett a társadalomtudósok számára az egyik legnyilvánvalóbb belépési pont a mesterséges intelligenciát, ezen belül is gépi tanulást alkalmazó kutatások területére.
A magyar tankönyvpiacon elsőként ismertetünk lépésről-lépésre a nemzetközi társadalomtudományban használatos olyan kvantitatív szövegelemzési eljárásokat, mint a névelemfelismerés, a véleményelemzés, a topikmodellezés, illetve a szövegek felügyelt tanulásra épülő osztályozása. A módszereink bemutatására szolgáló elemzéseket az egyik leggyakrabban használt programnyelv, az R segítségével végeztük el. A kötet anyaga akár minimális programozási ismerettel is elsajátítható, így teljesen kezdők számára is ajánlott. A hazai olvasók érdeklődését szem előtt tartva példáink döntő többsége új, magyar nyelvű korpuszokra épül, melyek alapján megismerhetők a magyar nyelvű kvantitatív szövegelemzés módozatai.
A könyv megrendelhető a Typotex kiadó honlapján!
2.0 - Online frissítések
A Szövegbányászat és mesterséges intelligencia R-ben szerkesztette Sebők Miklós, Ring Orsolya, és Máté Ákos frissített verziója már online elérhető, a könyv a MILAB projekt támogatásával került publikációra. Az eredeti kézirat több részét is kiegészítettük mind Szövegbányászati módszertannal, gyakorlati példákkal, és ábrázolási technikákkal.
Az újítások teljes listája:
- A szövegbányászat egy részletesebb meghatározása és definíciója a könyv bevezetőjében.
- A gyakorlati szövegbányászat fő lépéseit egy egyszerű példa mutatja be az olvasó számára Ady Endre és Petőfi Sándor versein keresztül.
- A könyvben felhasznált adatokhoz és a könyvben előállított ábrákhoz külön leíró részeket helyeztünk a szövegbe.
- Egy új alfejezet segíti az olvasót a saját adatai használatához.
- A könyv statikus ábráit interaktív megfelelőikre cseréltük ki.
- Új információk az adatábrázolással foglalkozó alfejezetben interaktív ábrák előállítására vonatkozóan.
- Az Osztályozás és felügyelt tanulás című fejezet immár mind az SVM és a Naïve Bayes módszer R-n belüli alkalmazását is bemutatja.
- Az Osztályozás és felügyelt tanulás című fejezetet kiegészítettük az itt bemutatott módszerek működésének közérthető leírásával.
- A Munka karakter vektorokkal című alfejezetet kiegészítettük az n-grammok leírásával.
Javasolt hivatkozás:
Sebők Miklós, Ring Orsolya, és Máté Ákos. 2021. Szövegbányászat és Mesterséges Intelligencia R-ben. Budapest: Typotex.
Bib formátumban:
@book{sebokringmate2021szovegbanyaszat,
address = {Budapest},
title = {Szövegbányászat és mesterséges intelligencia {R}-ben},
publisher = {Typotex},
author = {Sebők, Miklós and Ring, Orsolya and Máté, Ákos},
year = {2021}
}
A kötet alapjául szolgáló kutatást, amelyet a Társadalomtudományi Kutatóközpont valósított meg, az Innovációs és Technológiai Minisztérium és a Nemzeti Kutatási, Fejlesztési és Innovációs Hivatal támogatta a Mesterséges Intelligencia Nemzeti Laboratórium keretében.
A kötet megjelenését az MTA Könyvkiadási Alapja, a Társadalomtudományi Kutatóközpont Könyvtámogatási Alapja, a Nemzeti Kutatási, Fejlesztési és Innovációs Hivatal (NKFIH FK 123907, NKFIH FK 129018), valamint az MTA Bolyai János Kutatási Ösztöndíja támogatta.