Karins och Jonas blog om ord från inlägg som pingats hos var är du. Lite ordning, ganska mycket oordning och en hel del listor, Karin gillar listor.

mer lemonad:
jonas lemonad
var är du?
penn avenue
karin:s bagels och lemonad
Utseende:
jonas | karin
Prenumerera:
atom | rss
Arkiv:
december 2004
november 2004

Var är jag på bloggkartan?

måndag
20 december
2004

permalänk
1 kommentar och inga trackbacks

Leken som än så länge saknar namn hittar ni i bloggversion på var är du? Den uppdateras ungefär var femte minut för tillfället.

Blogglek (av Jonas)

Vad hette den där leken nu igen, den där som gick till på så sätt att man skrev en mening högst upp på ett papper, vek pappret och lät nästa person skriva en mening, varpå ny vikning skedde och pappret skickades vidare? Sedan när alla hade skrivit vecklade man ut pappret och försökte läsa allting utan att skratta sig helt fördärvad. Det var jättelänge sedan jag lekte den men idag har jag minsann gjort det igen–fast på bloggkartan. Det var egentligen tänkt att det skulle hamna här men så blev det inte (don't ask! 1)

Man kan nog lätt tro att det borde vara jättekul men för att ni inte skall bli för besvikna så bör jag nog förvarna om att de flesta bloggare inte alls är lika roliga som de var i tioårsåldern ;)

 

1) okej, om du verkligen vill veta så är det för att jag i helgen uppdaterat var är du till teckenkodningen utf-8 och den här bloggen fortfarande är kvar i iso-8859-1 så det passar inte ihop, helt enkelt.

lördag
11 december
2004

permalänk
1 kommentar och 2 trackbacks

cirkelresonemang 2 (av Jonas)

Statistik är som de flesta vet en svår balansgång. Ofta hävdas att man kan visa ungefär vad man vill genom att justera urval, analysmetod och presentation, vilket det ligger en hel del sanning i. På o/ordning är det nog sisådär med samvetet gällande den strikt objektiva statistiken, det blir faktiskt roligast så.

Skall man då här vikta statistiken? Det är ofta svårt för man måste precisera vad man vill få reda på och för det mesta är det mer allmängiltiga mycket mer tankeväckande. Samtidigt är det tänkt att o/ordnings analyser skall utvecklas och läsarna utvecklas med dem. Därför var det roligt att få flera kommentarer till förra inlägget som efterfrågade ett viktat resultat.

Jag funderade på några olika sätt att vikta men till slut fastnade jag för att jämföra antal inlägg med en eller flera självrefererande länkar med totalt antal inlägg från en blog. Detta kan du se i kolumn ett och två i topplistan nedan. Den tredje kolumnen visar andelen länkar till den egna bloggen jämfört med totalt antal länkar. Plötsligt blev det visst lite nördigt, det är nog bäst att Karin skriver nästa inlägg ;)

antalinl%tot%vem
4/70.570.16Emerging Communications
20/360.560.14Errata
10/180.560.11Medveten
2/40.500.18redvolume.com–weblog of m.jergefelt
5/100.500.05blog@stefangeens.com
3/60.500.08MittInternet.com
2/50.400.11subjektiv.se
8/220.360.04hakank.blogg
11/320.340.05Tesugen: Peter Lindberg’s Weblog/Blog
5/170.290.10haja: min kultursida på nätet
3/120.250.08Klippt och skuret
2/80.250.04Frihetsblogg
7/330.210.09Henrik Torstenssons Weblog
7/570.120.05Alicio i Underlandet
3/280.110.05p-blog–pierre andersson
4/390.100.04stationsvakt
4/450.090.04Det perfekta tomrummet
2/250.080.02...i elden
5/730.070.01Strang's Blog

I och med att jag tittade mer på resultatet blev jag tvungen att utesluta några bloggar för deras rss-flöde alltid innehöll länkar till dem själva i formen av "läs mer här" (456 berea street,) "kommentera här" (nätverkssamhället, tyvärr så blev dina femton minuter av berömmelse alldeles för korta Jonas! ;) och foton som var självlänkade (gnapp's photoblog.)

cirkelresonemang? (av Jonas)

Inlägg är inte bara ord, man kan faktiskt säga mycket om en blog baserat på vem som länkas till och och vem som länkar till den. Frågan är bara vad det säger om man länkar till sig själv? Fundera på det medan du läser nedanstående topplista över antal inlägg som länkat till sig själva under en två-, tre-veckorsperiod:

nrantalvem
119Errata
213Nätverkssamhället
39Tesugen: Peter Lindberg’s Weblog/Blog
48hakank.blogg
58Medveten
67Alicio i Underlandet
77Henrik Torstenssons Weblog
85456 Berea Street
95blog@stefangeens.com
105Strang's Blog
115haja: min kultursida på nätet
124Gnapp's photoblog
134Emerging Communications
144Det perfekta tomrummet
153p-blog ::: pierre andersson
163Klippt och skuret
173stationsvakt
182blog@isecore.net
192MittInternet.com
202redvolume.com - weblog of mikael jergefelt

Själv hoppas jag det betyder att bloggaren återvänt till ett ämnesområde som denne gillat och velat utveckla i senare inlägg. Kanske är det på så sätt att länkar till en själv faktiskt kan säga mer om ens blog än både utgående och ingående länkar?

glad! (av Karin)

Idag när jag satt och funderade lite över ord och tittade i statistiken så kom jag på att jag ville se hur glada bloggare varit på sistone. Jag tycker att alla borde få vara glada och dessutom gillar jag positiva, roliga och glada inlägg eftersom de smittar av sig. Glad blev jag också av sökningens resultat. Inte bara för att glad kommer redan på 44:e plats (bra!) bland de vanligaste använda orden de senaste två veckorna och har skrivits 17 gånger utan för att jag fick träff också på glada, speglade, googlade, färglade, jätteglad, gladde och gladpack.

Jag skulle nu kunna ta reda på i vilka sammanhang orden använts men det är roligare att spekulera själv. Glada, är det en glad fågel eller flera glada personer? Färg blir man glad av och det behövs nog särskilt i vintermörkret nu när den fina vita snön håller på att smälta bort så färglägg på bara! Jag tycker det vore väldigt bra om alla blev glada när de såg sig själva i spegeln. Roligast tycker jag dock att gladpack är, särskilt om det använts som synonym till julklapp såhär i julhandlingstider! :D

Bloggtidning (av Jonas)

Allt är inte bara enstaka ord, ibland vill man läsa dem i sitt sammanhang också. Ibland till och med på papper. För dig som åker t-bana, buss eller tåg till jobbet och saknar bärbar så kan du idag ändå läsa bloggar på resande fot. Klicka dig till jonas.lemonad.org, ladda hem och skriv ut :)

julord (av Karin)

Nu har julen invaderat oss. Jag inbillar mig kanske men jag tycker det är tidigare än vanligt. I Stockholm var det ju till och med skyltsöndag en vecka före första advent och första advent är ändå tidigt i år! Jag tycker det är märkligt. Även i bloggvärlden har julen trängt sig på, den senaste veckan har 24 olika julord använts (slump?), varav 21 med anknytning till julen. Julord som inte är julanknutna är juli, hjul och julias : ). Glögg, tomtar och knäck får snällt hålla sig i bakgrunden ett tag till, det här är bara ord som innehåller riktig jul.

nrantalord
34/3511jul/julen
34/379julklapp/julklappar
36/395julmust/julmusten
373julafton
38/393julbelysningen/julbelysning
392julstjärnan/julstjärnor
392julhelgens/julhelgen
391julhandeln
391julrim
391julbak
391julklappshetsen
391julskinka
391julstressen
391julhandla
391jul-relaterade
391juletid
391julklappstavlan
391julskyltning
391julbord
391julstämning
391jultradition

Julorden ligger alltså än så länge ända nere på 34:e plats på ordlistan men jag väntar med spänning på att se hur de kommer att röra sig uppåt :).

begynnelsebokstäver (av Jonas)

Idag har avdelningen för meningslös statistik jobbat helt utan hängslen, bälte och stopplista för att skapa en visualisering av bloggars begynnelsebokstäver. Kolumnen längst till vänster är förstabokstaven i ett ord, raden högst upp är andrabokstaven i ett ord. Rutan längst upp till vänster är ord som börjar på "aa" och rutan längst ned till höger är "öö". Ju mer blå rutan är desto oftare har kombinationen använts.

Varje kombination räknades dock bara en gång per inlägg för annars blev 'yo' väldigt vanligt och väldigt blå, de flesta andra rutor blev vita1. Det kan tyckas underligt att en begynnelsebokstav som y kan användas så ofta men på engelska är "you, your, you're", etc. tydligen så pass vanliga.

Hur som helst, enjoy! :)

-
Du kan förresten hålla muspekaren över de rutor vars kombinationer existerar så ser du ett trevligt exempelord.

 

1) Visualiseringen är linjär men det är inte omöjligt att en logaritmisk skala varit mer lämpad i det här fallet.

ord på topp vecka 47 (av Karin)

Oj så många ord! Oj så många listor man kan göra! Alla som besökt min sida (bagels och lemonad) vet att jag gillar att sammanställa saker i listor så det här är perfekt för mig :) Jag blir alldeles till mig och vet inte riktigt var jag ska börja! Material finns från i mitten av november och jag är lite nyfiken på vilka olika ord som varit populärast dag för dag. Populärast i den mening att de använts flesta gånger. Listan för den senaste veckan ser ut såhär:

dag (datum)antalord
måndag (15:e)14comments/bloggforum
tisdag (16:e)19bloggforum/orback/LO/problem
onsdag (17:e)30weblogs
torsdag (18:e)16weblogs
fredag (19:e)14liv
lördag (20:e)22dagbok
söndag (21:a)15information

Bloggforum, weblogs, information och dagböcker.. man skulle kunna tro att bloggsfären är en klubb för inbördes beundran, haha.

Om man istället kollar vilket ord som använts flest gånger dag för dag men när de endast räknats en gång per blogginlägg ser listan ut så här:

dag (datum)antalord
måndag (15:e)9stockholm
tisdag (16:e)7bloggforum
onsdag (17:e)8människor
torsdag (18:e)9johan
fredag (19:e)12liv
lördag (20:e)12artikel
söndag (21:a)9usa/direkt

Nu blev det en annan lista minsann! Jag vet inte vad jag hade väntat mig men det är inte förvånande att listorna ser olika ut, om man skriver om något så förekommer ordet ofta flera gånger i samma inlägg, det är inte konstigt alls. Weblogsengagerade är mest tjatiga, i genomsnitt upprepar de sig tre gånger i varje inlägg :) Bloggforum håller sin ledning på tisdagen både i antal förekomster totalt samt antal blogginlägg men delar förstnämnda plats med Orback och andra problem.

Om fredagens "liv" tänkte jag först att det är ju toppen, vilken härlig förstaplatstagare! Sen kom jag på att dessa inlägg handlar kanske egentligen om döden med tanke på Mikael Ljungbergs bortgång. Nu läser inte jag alla bloggar men om min gissning är rätt så innebär det alltså att liv betyder död och vilket bra exempel i så fall på hur fel det kan bli att plocka ord ur sitt sammanhang och hur missvisande statistik kan bli...

söndag
21 november
2004

permalänk
inga kommentarer eller trackbacks

Besök 10x10, där aktuella ord och bilder kopplas ihop på ett riktigt smart sätt.
Kolla även på daypop word burst som lyssnar efter ord som används mer ofta än andra och listar dem tillsammans med ett citat. Också väldigt smart!
intressant.se har nu också en tjänst där man listar populära fraser tillsammans med bloggar som använt dem.

På internet går allt fort... (av Jonas)

...ibland lite för fort. Några veckor sedan så lanserades siten 10x10 i samband med Bloggercon'04 och när jag såg den insåg jag genast att något liknande kunde låta sig göras på bloggkartan. Så jag skrev ihop ett program som extraherade alla ord från de sista dagarnas ping och rangordnade dem efter ordfrekvens. Det blev ungefär så här:

nrantalord
11500att
21466och
31360det
41046jag
51017är
61000som
7991en
8937
9723the
10684inte

vilket kanske inte var så jättespännande, även om det indikerar att bloggar på svenska är vanligast; första engelska ordet kommer på nionde plats1. Tanken var förstås att signifikanta ord för dagen, veckan, månaden eller året skulle dyka upp. Det som framför allt fattades var en stopplista; det vill säga en lista på hjälpverb, prepositioner, konjuktioner, adverb, och en mängd andra ordklasser jag och karin glömt sen högstadiet.

Efter att ha skrivit in så många ord från de fasta ordklasserna som vi kunde komma på, både på engelska och svenska, och en hel del ord till så var det uppenbart att de mest signifikanta orden alltid skulle vara bloggar, svenska, blogg, och sverige. Oavsett tidsperiod man tittade på. Bort med den svenska bloggosfären och plötsligt såg listan ut så här:

nrantalord
146arafat
231firefox
231kvinnor
324observer
422män
521människor
521barn
617information
716samhället
716media

Bra mycket bättre alltså2. Tanken var då att man som första steg i alla fall kunde göra en lista över populära ord varifrån man länkade till de bloggar som pingat dem. Ifall man sparade den vecka för vecka så skulle man om ett år kunna gå tillbaka och se vad som var populärt i början på november det här året, precis som man kan på på 10x10, très cool! Jag jobbade vidare med listan och urvalet av ord, mer om det i senare inlägg, utan att ha en aning om att jag några dagar senare skulle se den funktionen annonseras på intressant.se:s utvecklingsblog3, inspirerat av daypop:s word burst.

Tillbaka till ritbordet med andra ord! Om man inte fokuserar på de mest populära orden, ja då kanske man kan fokusera på ovanliga ord, de som kommer långt ned i listan? Eller kanske på långa ord eller orden med många konsonanter? Eller på ord helt enkelt, alla sorters ord.

En blog om ord var vad det fick bli och vi får se vad det blir av den. Klart är i alla fall att för var dag som går så finns det mer data att analysera. Själv var jag redan från dag ett förlorad i sökningar bland orden, det här hittade jag idag när jag sökte efter karin:

nrantalord
441karinmått
441karin
441älskarinna

hmm... intressant! ;)

 

1) ja, eller att bloggar på svenska har längre inlägg, mindre ordvariation, eller oftare har xml-flöde med fulltextinlägg. Många faktorer att väga in alltså.
2) lägg märke till att kvinnor hamnat högre upp i listan än män, det här kan bli googlejournalistik på högsta nivå!
3) wtf! :)