Az I. 507. feladat (2020. március) |
I. 507. (É). A honlapok látogatottságáról a webszerverek legtöbbször naplót vezetnek. Az általunk vizsgált weboldal naplójából részletek találhatók a webstat.txt szöveges állományban. A napló időrend szerint rendezett, egy-egy sorában egy látogatás adatai szerepelnek:
\(\displaystyle \bullet\) a használt böngésző neve, vagy egy kötőjel, ha a böngésző típusa nem volt megállapítható;
\(\displaystyle \bullet\) a böngészés dátuma (minden dátum 2020. februári);
\(\displaystyle \bullet\) a weboldalt felkereső kliensszámítógép IP-címe;
\(\displaystyle \bullet\) amennyiben a látogató az oldal címét beírva kereste föl a weboldalt, akkor a ,,honlap'' szó, egyébként annak a weboldalnak vagy alkalmazásnak a címe, ahonnan hivatkozással a honlapra került a látogató.
A szöveges állományban a fenti adatokat szóköz választja el a mintának megfelelően:
Készítsünk programot, amellyel megoldjuk a következő feladatokat. Minden feladatrész elkészítésekor írjuk ki a feladat sorszámát (pl. 1. feladat:), valamint a beolvasás és a kiírás formátumát a minták alapján oldjuk meg. Az ékezetmentes kiírás is elfogadott.
1. Olvassuk be és tároljuk el a webstat.txt állományt, majd adjuk meg, hogy hány adatsor szerepel a naplóban. Például: A beolvasott sorok száma: 300.
2. Adjuk meg táblázatos elrendezéssel, hogy az egyes napokon hány látogató adatai szerepelnek a naplóban. Például: 2020.02.11 59 látogató.
3. Soroljuk fel azokat a böngészőket, amelyek szerepelnek a naplóban. A listában minden név egyszer szerepeljen és a neveket vesszővel válasszuk el. Például: A böngészők: Chrome, Firefox, Safari, Edge, Opera.
4. Adjunk statisztikát arról, hogy a honlapot Chrome böngészővel felkeresők hogyan érték el a weboldalt. Számítsuk ki, hogy hány százalékuk adta meg a honlap címét, illetve hány százalékuk jött máshonnan a honlapra. Az eredményt egy tizedesjegyre kerekítve írjuk ki, például:
5. Vizsgáljuk meg az adatokat, és adjuk meg azokat az IP címeket, amelyekről egy adott napon többször is fölkeresték a weboldalt. A listában minden IP-cím csak egyszer szerepeljen. Az eredményt az alábbi formában adjuk meg:
Amely címekről többször is jártak az oldalon egy adott napon: 176.63.29.84, 176.63.7.203, 188.156.108.17 ...
6. Kérjünk be egy IP-címet, és adjuk meg, hogy mely napokon keresték föl a weboldalt a bekért címnek legalább az első két bájtjával azonos címekről. Készítsünk egy szöveges állományt, amelybe soronként megadjuk a talált napokat és IP-címeket a napló szerinti sorrendben. Az állomány neve a bekért IP-címből épüljön fel úgy, hogy a címben szereplő pontok helyére az aláhúzásjel kerüljön, és a kiterjesztése txt legyen.
Beküldendő egy i507.zip tömörített állományban a program forráskódja és egy rövid leírás, ami megadja, hogy a forrásállomány melyik fejlesztői környezetben fordítható.
Letölthető állomány: webstat.txt.
(10 pont)
A beküldési határidő 2020. április 14-én LEJÁRT.
Mintamegoldásként Mócsy Mátyás 10. évfolyamos, budapesti versenyző Java nyelven készült munkáját (I507.java), valamint Nagy Mátyás 12. osztályos, váci diák C# programját (i507.cs) adjuk közre.
Statisztika:
13 dolgozat érkezett. 10 pontot kapott: Mócsy Mátyás, Nagy 793 Márton, Szabó Barbara Noémi, Ürmössy Dorottya. 9 pontot kapott: Csahók Mihály, Horcsin Bálint. 8 pontot kapott: 3 versenyző. 6 pontot kapott: 4 versenyző.
A KöMaL 2020. márciusi informatika feladatai