Középiskolai Matematikai és Fizikai Lapok
Informatika rovattal
Kiadja a MATFUND Alapítvány
Már regisztráltál?
Új vendég vagy?

Az I. 507. feladat (2020. március)

I. 507. (É). A honlapok látogatottságáról a webszerverek legtöbbször naplót vezetnek. Az általunk vizsgált weboldal naplójából részletek találhatók a webstat.txt szöveges állományban. A napló időrend szerint rendezett, egy-egy sorában egy látogatás adatai szerepelnek:

\(\displaystyle \bullet\) a használt böngésző neve, vagy egy kötőjel, ha a böngésző típusa nem volt megállapítható;

\(\displaystyle \bullet\) a böngészés dátuma (minden dátum 2020. februári);

\(\displaystyle \bullet\) a weboldalt felkereső kliensszámítógép IP-címe;

\(\displaystyle \bullet\) amennyiben a látogató az oldal címét beírva kereste föl a weboldalt, akkor a ,,honlap'' szó, egyébként annak a weboldalnak vagy alkalmazásnak a címe, ahonnan hivatkozással a honlapra került a látogató.

A szöveges állományban a fenti adatokat szóköz választja el a mintának megfelelően:

Készítsünk programot, amellyel megoldjuk a következő feladatokat. Minden feladatrész elkészítésekor írjuk ki a feladat sorszámát (pl. 1. feladat:), valamint a beolvasás és a kiírás formátumát a minták alapján oldjuk meg. Az ékezetmentes kiírás is elfogadott.

1. Olvassuk be és tároljuk el a webstat.txt állományt, majd adjuk meg, hogy hány adatsor szerepel a naplóban. Például: A beolvasott sorok száma: 300.

2. Adjuk meg táblázatos elrendezéssel, hogy az egyes napokon hány látogató adatai szerepelnek a naplóban. Például: 2020.02.11   59 látogató.

3. Soroljuk fel azokat a böngészőket, amelyek szerepelnek a naplóban. A listában minden név egyszer szerepeljen és a neveket vesszővel válasszuk el. Például: A böngészők: Chrome, Firefox, Safari, Edge, Opera.

4. Adjunk statisztikát arról, hogy a honlapot Chrome böngészővel felkeresők hogyan érték el a weboldalt. Számítsuk ki, hogy hány százalékuk adta meg a honlap címét, illetve hány százalékuk jött máshonnan a honlapra. Az eredményt egy tizedesjegyre kerekítve írjuk ki, például:

5. Vizsgáljuk meg az adatokat, és adjuk meg azokat az IP címeket, amelyekről egy adott napon többször is fölkeresték a weboldalt. A listában minden IP-cím csak egyszer szerepeljen. Az eredményt az alábbi formában adjuk meg:

Amely címekről többször is jártak az oldalon egy adott napon: 176.63.29.84, 176.63.7.203, 188.156.108.17 ...

6. Kérjünk be egy IP-címet, és adjuk meg, hogy mely napokon keresték föl a weboldalt a bekért címnek legalább az első két bájtjával azonos címekről. Készítsünk egy szöveges állományt, amelybe soronként megadjuk a talált napokat és IP-címeket a napló szerinti sorrendben. Az állomány neve a bekért IP-címből épüljön fel úgy, hogy a címben szereplő pontok helyére az aláhúzásjel kerüljön, és a kiterjesztése txt legyen.

Beküldendő egy i507.zip tömörített állományban a program forráskódja és egy rövid leírás, ami megadja, hogy a forrásállomány melyik fejlesztői környezetben fordítható.

Letölthető állomány: webstat.txt.

(10 pont)

A beküldési határidő 2020. április 14-én LEJÁRT.


Statisztika:

Az I. 507. feladat értékelése még nem fejeződött be.


A KöMaL 2020. márciusi informatika feladatai