Mathematical and Physical Journal
for High Schools
Issued by the MATFUND Foundation
 Already signed up? New to KöMaL?

Problem I. 312. (January 2013)

I. 312. More and more web pages feature images similar to this one (see the figure).

The image represents the tag cloud (or word cloud) of the topics of the oral part of an advanced exam in informatics in Hungary. According to the English Wikipedia, a tag cloud ...is a visual representation for text data, typically used to depict keyword metadata (tags) on websites, or to visualize free form text. Tags are usually single words, and the importance of each tag is shown with font size or color. This format is useful for quickly perceiving the most prominent terms and for locating a term alphabetically to determine its relative prominence.''

Your task now is to collect several tools or programs suitable to generate tag clouds. By selecting one of them, you should analyze some text samples: by considering the corresponding tag clouds, you should compare

the text of all poems of a famous poet written in a specific year with all the other poems written in a different year;

two novels of a writer;

two scientific works on the same topic.

Then, you should select a different tool from your list, and analyze one of the novels with this tool as well.

You should create a presentation visualizing your findings and summarizing your conclusions.

Your presentation (i312.ppt, i312.odp, ...) together with a documentation (i312.pdf) of the analysis should be submitted, also containing the name and location of the tools you have found.

(10 pont)

Deadline expired on February 11, 2013.

Sorry, the solution is available only in Hungarian. Google translation

A megoldásokat szemlélve kiderült, hogy a feladat nem volt kellő pontossággal definiált. A "vessük össze az eredményeket", "fogalmazzuk meg tapasztalatainkat" elvárásokat nehéz volt értékelni. Végül azt tekintettük teljes értékű összevetésnek a művek kapcsán, ahol a mennyiségek puszta rögzítésén túlmutató megállapításokat is tettek a beküldők.

A legnagyobb problémát mégsem az összevetés jelentette, hanem a forrásmegjelölés. Ez nem csak a címkefelhő készítő eszközök kapcsán elvárás, hanem a felhasznált művek esetén is. Ezt a feladatban nem szükséges külön kiemelni, hiszen egy iskolai dolgozatnak is része. Ezeknél a pontos url (ami a műre mutat) és a rögzítés időpontja jelenti általában a helyes módját a hivatkozásnak.

A feladat kapcsán fontosnak tartottuk, hogy a megoldó utaljon a nyelvvel kapcsolatos problémáknak legalább egyikére, például az ékezetes karakterek kezelése.

Az egyes eszközök elemzése Fényes Balázs dokumentációjában (i312.pdf) volt a legteljesebb, míg a prezentációk közül Qian Líviáét találtuk a legtartalmasabbnak (i312.pptx).

Statistics:

 7 students sent a solution. 9 points: Gema Barnabás, Németh 017 András, Qian Lívia, Tomku György. 8 points: 3 students.

Problems in Information Technology of KöMaL, January 2013