Középiskolai Matematikai és Fizikai Lapok
Informatika rovattal
Kiadja a MATFUND Alapítvány
Már regisztráltál?
Új vendég vagy?

Fórum: Magyar nyelvtan

Szeretnél hozzászólni? Jelentkezz be.
[20] lgdt2005-05-21 13:10:48

angolul sajna nemtok elég jól ehhez. maradok a magyarnál, ahol a ragok is sokat segítenek.

[19] jonas2005-05-21 11:11:33

Ha ilyet csinálsz, talán érdekel egy hasonló feladat a Perl Quiz of the Week-ről. Az Expert Quiz #18-ról van szó, aminek itt a kitűzése, a hivatalos értékelése, és a discussion lista megfelelő szelete.

Előzmény: [18] lgdt, 2005-05-21 09:27:53
[18] lgdt2005-05-21 09:27:53

Csináltam mondatértelmezőkét is. A bővítmény nélküli tagmondatokat, a "ha", a "vagy", az "és" és a "nem" szavakat képes megismerni.

input-output példák:

# ha esik az eső, akkor vizes az út

# az eső esik

az út vizes

---

# ha vizes az út, akkor esik az eső vagy locsolják

# az út vizes

az eső esik vagy locsolják

# az eső nem esik

locsolják

---

# ha a lámpa ég és megfelelő a páratartalom, akkor a lámpa látszik

# a lámpa nem látszik

a lámpa nem ég vagy a páratartalom nem megfelelő

# a páratartalom megfelelő

a lámpa nem ég

---

ezt még nem kapjátok meg. ötvözni akarom a ragozóval, a ragfelismerővel és a legújabb AI algommal. :D

meg azt akarom, hha talál magára vonatkozó utasítást a memóriában, akkor végrehajtsa (akár olyat is, ami arra vonatkozik, h h kell értelmezni a mondatokat).

amúgy már a mostani verzió is képes megoldani néhány köcsög matlog példát. :-D a következőt már az einsteini feladattal tesztelem. :-D

[17] lgdt2005-01-05 19:23:18

Az utolsó sorba írtad kifejezést nem is vettem észre a múltkor. Gyorsan (mondatonként) olvasva nem feltűnő.

Előzmény: [11] lgdt, 2004-12-09 16:03:59
[16] Gubbubu2005-01-03 16:49:30

Én pedig az irodalomhoz hozzáteszem Prószéky Gábor: Számítógépes nyelvészet c. könyvét. Jó.

Előzmény: [12] Hajba Károly, 2004-12-10 01:19:05
[15] Gubbubu2005-01-03 16:42:24

Kedves Onogur!

Mivel nálam jobban értesz hozzá, megkérhetlek-e esetleg arra, hogy lektoráld az alábbi, elsősorban általam írt (pontosabban lektorált) 2-3 bekezdést?

http://en.wikipedia.org/wiki/Hungarian language#VowelHarmony

Köszönöm, akár megteszed, akár nem. G.

U.I. Jelenleg az "eset" (casus) fogalmával is rengeteget küszködünk.

Előzmény: [5] Hajba Károly, 2004-12-06 10:27:35
[14] lgdt2004-12-10 20:08:36

Ja igen, elfelejtettem leírni: a végső algo a matematikai logika szabályait fogja használni (egészen pontosan érvényben tartani). De ez még távoli cél. Majd később beszélünk róla, ha már nagyjából tudunk természetes mondatokat generálni formális állításokból.

[13] lgdt2004-12-10 19:59:33

Köszönöm a segítséget.

Kétféle hangzókiesést kezel: a -Vg-re végződő igéknél más szabályok érvényesek, mint az -ez végűeknél.

Egyelőre az -ez végűeket így szűri:

ha "e*ez"-re vagy "é*ez"-re végződő nem ikes igéknél esik ki az e, ahol a * helyén nem g és nem j áll.

Most azon gondolkozom, hogy könnyebb lenne minden, ha megismerné az igekötőket. Viszont ez főnévadatbázis nélkül sajnos nem lehetséges, így kénytelen vagyok egy csomó kivételes esetet beleépíteni a kódba (eddig kb. 20 van).

Ezt a php oldalt elsősorban azért csináltam, hogy az így kialakuló szabályrendszer jó heurisztika legyen a végső algo-nak, ami "magától" tanul beszélni. Persze az is lehetséges, hogy a "hardwired" szabályok is alkalmasak valami primitív chatbot elkészítéséhez.

[12] Hajba Károly2004-12-10 01:19:05

Kedves lgdt!

Néhány észrevétel a rutinodhoz:

A második szakaszt bátran nevezd mediális párnak, mivel többféle értelemben is használatos és ez a szakkifejezése. Gyakorlatilag a -(V)dik képző segítségével a korábbi tárgyat alanyi helyzetbe hozzod és a vmitől/valami által vonzatott kapja, de ez nem feltétlen önmagára utalást jelent.

Tájékoztatási jelleggel tájékoztatlak, hogy tájnyelvi környezetben létezik még egy igenévi alak, ez pedig az igei igenév. Ezt a formulát múltidejű állapotban (brahiból :o) rendszeresen használom a neten. Eddig még senki nem kérdezett vissza, hogy mi bajom van, pedig az irodalmi nyelvhasználat nem ismeri. Gyakorlatilag a tárgyas ragozási sorral egyezik meg. Pl. Az általam lefutott táv. ==> Lefutottam táv. Tömörebb szerkezet.

Néhány -(e)z képzőjű igénél kiesik az e hang, de mintha a Te példáidban olyankor is kiesik, mikor nem kellene. Ezt az esetet, hogyan kezeli a rutinod?

A hangugrató eseteket gyűjtöm, hogy valami szabályosságot lehessen kialakítani. Mindettől függetlenül gyanítom, hogy egy kivétellistát kell képezni. Sajnos itt a Word helyesírás ellenőrzője nem segít, mivel minden nem kieső alakot - egy kivételével - átenged. (*érezett - érzett, de érezek - érzek) Feltehetően itt már a jelentéshasadás esetével találkozunk. Furcsán hangzik, de elvileg nem hibás a szerezett alak a szerzett-tel szemben. Az előbbi: egy szerrel csinálni valamit, míg az utóbbi: (meg)szerezni egy dolgot. S mindkettőnek azonos az alapigéje: szerezni. Ezen kettős alakok miatt elég nehéz lesz a paradigmasorokat kitalálni.

Továbbra is javaslom Neked az említettem szakkönyv beszerzését.

Üdv: HK

Előzmény: [11] lgdt, 2004-12-09 16:03:59
[11] lgdt2004-12-09 16:03:59

Köszönöm a hozzászólásokat. Az oldalt fejlesztettem.

A hangrend szerinti illeszkedés szabálya kevés igére mondja meg, hogy végül milyen ragot kap, és azok jelentős részénél is rosszul.

a legtöbb ige az utolsó magánhangzója szerint 3 kategóriába sorolható:

1. aáoóuúií 2. oőüű 3. eé

kategóriaszám szerint E/1-ben pl. (1-o 2-ö 3-e)+k ragot kap az ige.

ez akkor nem érvényes, ha az ige tövének utolsó magánhangzója "i" vagy í, ekkor az utolsó előtti magánhangzó dominál, de a 2. kategória kiesik. ha egyszótagú az igető, akkor az 1.-es kategória lép életbe, kivétel: "csíp" és "int".

szerintem valami ilyesmi lehet az é-re végződő főneveknél is.

[10] Hajba Károly2004-12-06 23:38:37

Kedves Géza és lgdt!

Alább egy kicsit bővebben kifejtem a felmerült érdekes és kivételes ragozású szavak eredetét. Nem öncélúan teszem, hanem egyrészről érdekesség gyanánt; másrészről lgdt részére bemutatandó, hogy a kivételek nem véletlenszerűen adódnak, alakulnak ki, hanem sok törvényszerűség tapasztalható bennük, csak ez a nyelvfejlődés során alakul ki. Elméletileg ezek egy tekintélyes részét is meg lehet fogni valamely szabályosság leírásával. S már meg is érkeztünk a matematikai nyelvészet határmezsgyéjéhez. (Már csak, hogy ne legyünk OFF-ok :o)

A derék szavunk az etimológiai szótárak szerint egy nagyon korai szláv átvétel lehet dreku formában, ahol a szótag domináns magánhangzója egy a mainál hátrább képzett e hang lett, míg akkor a szóvégén nem lehetett csak magánhangzó, így oda kapott egy u félhangzót. Ezen félhangzóból ered a közbülső képzési helyű a toldalékhang. (S ezen félhang fejleményeként jelenik meg a kapu, gyalu, falu, apu ... szavainkban, továbbá sok ragozási sorban megjelenő -v- toldalékhangban. hó-havas, lő-lövök)

Az ómagyar nyelv a szóeleji mássalhangzó-torlódást sem tűrte el, ezért a dr közé valamely magánhangzó ékelődött be tájnyelvtől függően. ( > dVreku) Ezek közül az e-s változat győzött az irodalmi nyelvváltozat kialakulása során.

Az e>é átmenet egy középkorban létrejött nyelvfejlődési hatás eredményezi, mely sok alapszó utolsó rövid magánhangzóját megnyújtotta. Lásd: veréb-verebek, tehén-tehenek, darázs-darazsak, ...

A héj szavunk a haj ikerszava és ősi finnugor eredetű. Feltehetően a korábbról kimutatható ikerpárból szóhasadással jött létre, a magánhangzó helyén szélesebb skálájú hang állhatott.A két szélső hangot márjól meg lehetett különböztetni.Erre jött ráegy jelentésbővülés, mely a két hangváltozatnak más és más jelentést adott. Így szép lassan elváltak, de a ragozási soruk nem változott.

A cél szavunk valóban német eredetű, ahogy már Géza is jelezte. Itt egy mélyebb azaz hátrább képzett i-vel került át a nyelvünkbe. Középnémet régies zel, felnémet régies zil alakok átvétele a lovagi játékok átvétele során, mint szakszó. Mivel a magyar nyelv rendhagyó ragozásából következtetni lehet az átvett szó korabeli hangállapotára, a német etimológia akár figyelembe is veheti a Ziel szavuk korai hangállapotának kiderítése során, mint megerősítés.

A fenti példákból láthatjuk, hogy a rendhagyó állapotoknak nyelvtörténeti eredetük van és ezek leírható szabályszerűségek: kötelezőszóvégi magánhagzó ill. szóeleji magánhangzó-torlódás tilalma az ómagyar korban; megszünő és változó hangók; alapszó végi magánhangzó nyúlás, szóhasadás toldaléksor megtartásával, ...

HK

Előzmény: [9] Kós Géza, 2004-12-06 18:21:24
[9] Kós Géza2004-12-06 18:21:24

Én is ezeket ismerem. A héj és a derék esetében az a változhatott át (haj, darék). A cél pedig a német Ziel-ből jöhetett, és az í változott é-vé.

Előzmény: [7] Hajba Károly, 2004-12-06 11:27:38
[8] Hajba Károly2004-12-06 12:35:53

Kedves lgdt!

Néhány észrevétel a rutinoddal kapcsolatban:

-Gondolom nem lep meg, hogy a magánhangzóra végződő igéket és sok egyéb képzővel már ellátott igéket nem képzi helyesen;

-Látom beleépítetted a -Vg végű igéket is, de nem mind egy kaptafára ragozódik. Hibák: farag, ballag, kullog

Egyelőre ennyit találtam.

HK

Előzmény: [1] lgdt, 2004-12-04 12:53:03
[7] Hajba Károly2004-12-06 11:27:38

Derekasan gondolkodtam és ráleltem a megoldás héjaira, azaz: derék - derekak, héj - héjak.

HK

Előzmény: [6] Kós Géza, 2004-12-06 10:51:17
[6] Kós Géza2004-12-06 10:51:17

Kedves Károly,

Valóban a cél az egyik kivétel. A másik két példát (még) nem árulom el. :-)

A háromfokozatú besorolás szerintem is sokkal pontosabb.

Előzmény: [5] Hajba Károly, 2004-12-06 10:27:35
[5] Hajba Károly2004-12-06 10:27:35

Kedves Géza!

Az e, é hangzók körében csak egy példa ugrott most be: cél - célok, de a szintén magas hangrendű í-s szavak körében sok van, mely hangrendileg nem illeszkedik:

sír - sírok, síp - sípok, híd - hidak, sík - síkok, sír - sírok, bír - birok, fing - fingok (elnézést, de hát ez is a magyar nyelv része és ide tartozik :o)

De kiváncsi vagyok a másik két példádra.

A fenti példák, és feltehetően a tieid is egy ómagyar alsó-közép magasságú (közbülső elölségű, velár-centrális) ü-re (orosz jer ü) vezethető vissza, mely hang idővel magasabban (elülsőbben) képződött és összeolvadt az é ill. í hangokkal, de képzőik maradtak az eredeti pozicióban.

(Csak érdekesség gyanánt: A mai szakirodalom már elülső, közbülső és hátsó elölségű magánhangzót említ a magas ill. mély helyett, mivel ez pontosabban írja le a nyelvállást. A régi leírás artikuláció szempontjából indokolatlan, habár szép metafora és szubjektíven meg is állja a helyét.)

HK

Előzmény: [4] Kós Géza, 2004-12-06 09:29:37
[4] Kós Géza2004-12-06 09:29:37

Sziasztok,

Én jobban szeretem a meglepő kivételeket gyűjteni.

A kedvenc példám:

Az e és az é magánhangzó mindig magas, és ha egy szó csak ezeket a magánhangzókat tartalmazza, akkor magas hangrendű ragokat kap. Kivéve ...

Három kivételt ismerek, de biztosan van több is.

Üdv.

Géza

[3] Hajba Károly2004-12-06 00:50:32

Kedves lgdt!

Örülök, hogy a nyitottam téma (M és Ny) egy részterületével újabb topikot nyitottál. Ez azt jelenti, hogy többen érdeklődést mutatnak a téma iránt.

Nos amiről írsz, jóval tágabb vonatkozásban már eléggé alaposan fel van dolgozva és a műhely, ahol ezzel foglalkoznak a MTA Nyelvtudományi Intézete. Gyakorlatilag ez a feladatuk. :o) Ennek jelen eredményeként 2000-ben megjelentették a többkötetes Strukturális Magyar Nyelvtan című kiadványt, melynek közel 1100 oldalas 3. Morfológia kötetében van az érdekelted téma (igaragozás) is leírva. A kötet közismertebb szerzői: Kiefer Ferenc, Pléh Csaba és Prószéki Gábor (Morphologic).

Az általános igeragozás személyragjainak összevont jelen idejű alakjai:

Egyes szám
Első személy: -Vk
Második személy: -(A)sz, -Vl
Harmadik személy:
Többes szám:
Első személy: -Unk
Második személy: -(V)tVk
Harmadik személy: (A)nAk

Ennek értelmezése során ismerni kell a fonológiai alapvető jelőlési rendszert. V - általános magánhangzó (vokális), U - [u, ü] hangok, A - [a, e] hangok, (A) - az A hang zérussal alternál azaz el is tünhet, Ø - üres hang helye.

Az E/2-ben pl. egyes tájnyelvek szavai -sz helyett -l ragot is kaphatnak (futol, mondol, ...)

A konkrét rag formájára realizációs szabályok léteznek. Itt figyelembe veszik az ige szabályosságát vagy lexikai egységét, idejét, számát, személyét, tárgyasságát, módját; továbbá létezik egy illeszkedési szabály a magánhangzók illeszkedésére. Gyakorlatilag Te egy ehhez hasonló, de csökkentett tudású kis rutint írtál.

A rendhagyó ragozási sorokat is meg lehetne ragadni, csak ahhoz nyelvtörténeti törvényszerűségekre is figyelni kell. A rendhagyó sorok struktúrájával már nem foglalkozik a fenti mű. Ez egy keményebb dió lehet.

HK

Előzmény: [1] lgdt, 2004-12-04 12:53:03
[2] lgdt2004-12-04 12:55:26

sorry, nem gontoltam, hogy ez a TeX elrontja a királyul megformázott szövegemet. azért nagyjából lehet érteni.

[1] lgdt2004-12-04 12:53:03

A magyar nyelvben szeretnék olyan formális szabályokat találni, amelyek alól kevés a kivétel. Ehhez kérek Tőletek segítséget.

Az igeragozással már foglalkoztam, írok egy példát:

Jelen idő, alanyi ragozás az igéket 3 kategóriába soroltam (ezentúl igének hívom az ige E/3 alakját "ik" nélkül)

ha "ít"-re vagy "iz"-re végződik, akkor az utolsó előtti magánhangzó szerint az ige: "aáoóuúií" esetén: 1-es kategóriájú "öőüűeé" esetén: 3-es kategóriájú

egyébként az utolsó magánhangzó szerint: "aáoóuúií" esetén: 1-es kategóriájú "öőüű" esetén: 2-es kategóriájú "eé" esetén: 3-mas kategóriájú

E/1 1. ha az ige magánhangzóra végződik, akkor "v"-t kell mögé fűzni 2. a következő betű az ige kategóriája szerint: 1: "o" 2: "ö" 3: "e" 3. a rag utolsó betűje mindig "k"

E/2: 1. ha az ige magánhangzóra végződik, akkor "v"-t kell mögé fűzni 2. ha "z"-re végződik, akkor a toldalék kategória szerint 1: "o" 2: "ö" 3: "e", majd "l" 3. ha "ít"-re végződik, vagy dupla mássalhangzóra, akkor a toldalék kategória szerint 1: "a" 2: "e" 3: "e", majd "sz" 4. ha bármi másra végződik, akkor a toldalék "sz"

E/3 1. ha ikes ige, akkor a toldalék: "ik"

T/1 1. ha az ige magánhangzóra végződik, akkor "v"-t kell mögé fűzni 2. a következő betű az ige kategóriája szerint: 1: "u" 2: "ü" 3: "ü" 3. a rag utolsó 2 betűje mindig "nk"

stb...

A fenti rendszer alól kivétel pl. a "van", "jön", "megy" és a "szerez" ige.

Tudtok ilyen konkrét leírásokat?

Írni fogok programot, ami toldalékolt szavakat, szószerkezeteket, majd mondatokat generál adott séma szerint. Szerintetek jó ötlet? Lehetséges? Segítetek a tesztelésben, a szabályok és kivételek felfedezésében, és esetleg a fejlesztésben?

A fenti szabályt itt lehet próbálgatni.