Karins och Jonas blog om ord från inlägg som pingats hos var är du. Lite ordning, ganska mycket oordning och en hel del listor, Karin gillar listor.

mer lemonad:
jonas lemonad
var är du?
penn avenue
karin:s bagels och lemonad
Utseende:
jonas | karin
Prenumerera:
atom | rss
Arkiv:
december 2004
november 2004

Var är jag på bloggkartan?

julord (av Karin)

Nu har julen invaderat oss. Jag inbillar mig kanske men jag tycker det är tidigare än vanligt. I Stockholm var det ju till och med skyltsöndag en vecka före första advent och första advent är ändå tidigt i år! Jag tycker det är märkligt. Även i bloggvärlden har julen trängt sig på, den senaste veckan har 24 olika julord använts (slump?), varav 21 med anknytning till julen. Julord som inte är julanknutna är juli, hjul och julias : ). Glögg, tomtar och knäck får snällt hålla sig i bakgrunden ett tag till, det här är bara ord som innehåller riktig jul.

nrantalord
34/3511jul/julen
34/379julklapp/julklappar
36/395julmust/julmusten
373julafton
38/393julbelysningen/julbelysning
392julstjärnan/julstjärnor
392julhelgens/julhelgen
391julhandeln
391julrim
391julbak
391julklappshetsen
391julskinka
391julstressen
391julhandla
391jul-relaterade
391juletid
391julklappstavlan
391julskyltning
391julbord
391julstämning
391jultradition

Julorden ligger alltså än så länge ända nere på 34:e plats på ordlistan men jag väntar med spänning på att se hur de kommer att röra sig uppåt :).

begynnelsebokstäver (av Jonas)

Idag har avdelningen för meningslös statistik jobbat helt utan hängslen, bälte och stopplista för att skapa en visualisering av bloggars begynnelsebokstäver. Kolumnen längst till vänster är förstabokstaven i ett ord, raden högst upp är andrabokstaven i ett ord. Rutan längst upp till vänster är ord som börjar på "aa" och rutan längst ned till höger är "öö". Ju mer blå rutan är desto oftare har kombinationen använts.

Varje kombination räknades dock bara en gång per inlägg för annars blev 'yo' väldigt vanligt och väldigt blå, de flesta andra rutor blev vita1. Det kan tyckas underligt att en begynnelsebokstav som y kan användas så ofta men på engelska är "you, your, you're", etc. tydligen så pass vanliga.

Hur som helst, enjoy! :)

-
Du kan förresten hålla muspekaren över de rutor vars kombinationer existerar så ser du ett trevligt exempelord.

 

1) Visualiseringen är linjär men det är inte omöjligt att en logaritmisk skala varit mer lämpad i det här fallet.

ord på topp vecka 47 (av Karin)

Oj så många ord! Oj så många listor man kan göra! Alla som besökt min sida (bagels och lemonad) vet att jag gillar att sammanställa saker i listor så det här är perfekt för mig :) Jag blir alldeles till mig och vet inte riktigt var jag ska börja! Material finns från i mitten av november och jag är lite nyfiken på vilka olika ord som varit populärast dag för dag. Populärast i den mening att de använts flesta gånger. Listan för den senaste veckan ser ut såhär:

dag (datum)antalord
måndag (15:e)14comments/bloggforum
tisdag (16:e)19bloggforum/orback/LO/problem
onsdag (17:e)30weblogs
torsdag (18:e)16weblogs
fredag (19:e)14liv
lördag (20:e)22dagbok
söndag (21:a)15information

Bloggforum, weblogs, information och dagböcker.. man skulle kunna tro att bloggsfären är en klubb för inbördes beundran, haha.

Om man istället kollar vilket ord som använts flest gånger dag för dag men när de endast räknats en gång per blogginlägg ser listan ut så här:

dag (datum)antalord
måndag (15:e)9stockholm
tisdag (16:e)7bloggforum
onsdag (17:e)8människor
torsdag (18:e)9johan
fredag (19:e)12liv
lördag (20:e)12artikel
söndag (21:a)9usa/direkt

Nu blev det en annan lista minsann! Jag vet inte vad jag hade väntat mig men det är inte förvånande att listorna ser olika ut, om man skriver om något så förekommer ordet ofta flera gånger i samma inlägg, det är inte konstigt alls. Weblogsengagerade är mest tjatiga, i genomsnitt upprepar de sig tre gånger i varje inlägg :) Bloggforum håller sin ledning på tisdagen både i antal förekomster totalt samt antal blogginlägg men delar förstnämnda plats med Orback och andra problem.

Om fredagens "liv" tänkte jag först att det är ju toppen, vilken härlig förstaplatstagare! Sen kom jag på att dessa inlägg handlar kanske egentligen om döden med tanke på Mikael Ljungbergs bortgång. Nu läser inte jag alla bloggar men om min gissning är rätt så innebär det alltså att liv betyder död och vilket bra exempel i så fall på hur fel det kan bli att plocka ord ur sitt sammanhang och hur missvisande statistik kan bli...

söndag
21 november
2004

permalänk
inga kommentarer eller trackbacks

Besök 10x10, där aktuella ord och bilder kopplas ihop på ett riktigt smart sätt.
Kolla även på daypop word burst som lyssnar efter ord som används mer ofta än andra och listar dem tillsammans med ett citat. Också väldigt smart!
intressant.se har nu också en tjänst där man listar populära fraser tillsammans med bloggar som använt dem.

På internet går allt fort... (av Jonas)

...ibland lite för fort. Några veckor sedan så lanserades siten 10x10 i samband med Bloggercon'04 och när jag såg den insåg jag genast att något liknande kunde låta sig göras på bloggkartan. Så jag skrev ihop ett program som extraherade alla ord från de sista dagarnas ping och rangordnade dem efter ordfrekvens. Det blev ungefär så här:

nrantalord
11500att
21466och
31360det
41046jag
51017är
61000som
7991en
8937
9723the
10684inte

vilket kanske inte var så jättespännande, även om det indikerar att bloggar på svenska är vanligast; första engelska ordet kommer på nionde plats1. Tanken var förstås att signifikanta ord för dagen, veckan, månaden eller året skulle dyka upp. Det som framför allt fattades var en stopplista; det vill säga en lista på hjälpverb, prepositioner, konjuktioner, adverb, och en mängd andra ordklasser jag och karin glömt sen högstadiet.

Efter att ha skrivit in så många ord från de fasta ordklasserna som vi kunde komma på, både på engelska och svenska, och en hel del ord till så var det uppenbart att de mest signifikanta orden alltid skulle vara bloggar, svenska, blogg, och sverige. Oavsett tidsperiod man tittade på. Bort med den svenska bloggosfären och plötsligt såg listan ut så här:

nrantalord
146arafat
231firefox
231kvinnor
324observer
422män
521människor
521barn
617information
716samhället
716media

Bra mycket bättre alltså2. Tanken var då att man som första steg i alla fall kunde göra en lista över populära ord varifrån man länkade till de bloggar som pingat dem. Ifall man sparade den vecka för vecka så skulle man om ett år kunna gå tillbaka och se vad som var populärt i början på november det här året, precis som man kan på på 10x10, très cool! Jag jobbade vidare med listan och urvalet av ord, mer om det i senare inlägg, utan att ha en aning om att jag några dagar senare skulle se den funktionen annonseras på intressant.se:s utvecklingsblog3, inspirerat av daypop:s word burst.

Tillbaka till ritbordet med andra ord! Om man inte fokuserar på de mest populära orden, ja då kanske man kan fokusera på ovanliga ord, de som kommer långt ned i listan? Eller kanske på långa ord eller orden med många konsonanter? Eller på ord helt enkelt, alla sorters ord.

En blog om ord var vad det fick bli och vi får se vad det blir av den. Klart är i alla fall att för var dag som går så finns det mer data att analysera. Själv var jag redan från dag ett förlorad i sökningar bland orden, det här hittade jag idag när jag sökte efter karin:

nrantalord
441karinmått
441karin
441älskarinna

hmm... intressant! ;)

 

1) ja, eller att bloggar på svenska har längre inlägg, mindre ordvariation, eller oftare har xml-flöde med fulltextinlägg. Många faktorer att väga in alltså.
2) lägg märke till att kvinnor hamnat högre upp i listan än män, det här kan bli googlejournalistik på högsta nivå!
3) wtf! :)