Ode aan de Boskoop

Tijdens het wandelen met labrador Lars als naar goede gewoontje een appeltje gegeten en ik moet zeggen: er gaat niets boven een Boskoop! Niet te hard maar ook niet te zacht, lichtjes zuur, herfstige kleuren … Morgen terug van dadde!!

boskoop op wikipedia

Mijn vaders muziek: Neil Sedaka

De liefde voor muziek, die heb ik van mijn vader. Toen ik nog een klein futttaatje was, zongen we onder zijn begeleiding allemaal samen in de auto, over “de toren van zaltbommel” en “die kat kwam weer” en veel andere liedjes melodietjes uit de oude doos die ik al vergeten ben en Jan Theys is er niet meer om ons te helpen herinneren … En we gingen we naar de bibliotheek (of heette dat toen niet discotheek?) in Willebroek om LP’s met muziek van o.a. Händel en Mozart te ontlenen. Of we luisterden naar de 5de van Beethoven en dat moest natuurlijk luid staan.
Maar eind jaren ’50 begin jaren ’60, als tiener, was mijn vader nog niet gebeten door het klassieke muziek-virus en luisterde hij op zondagmiddag van 13 tot 14h vol overgave naar de “piraten” van Radio Luxemburg, “Your station of the stars”. Eén van de stars waarmee hij hoog opliep was Neil Sedaka. De verzamel-LP van die man was dan ook één van de niet-klassieke platen die we thuis grijs draaiden.
Vandaar 3 Sedaka-YouTubekes om het weekend swingend (weliswaar op een vreemde jaren ’50 teenybobber manier) mee in te zetten:

  • Oh Carol” schreef Neil als 19-jarige snotneus voor ex-sweetheart Carol King, die prompt antwoorde met “Oh Neil”. Het kwam nooit meer goed, maar Neil heeft het ondanks de dramatische voorspelling (“Cause if you leave me, I will surely die”) overleefd; hij treedt nu, bijna 50 jaar later, nog altijd op!

  • Of “Breaking up is hard to do” ook over Carole King gaat, is niet gedocumenteerd, maar de man leek alleszins stevig vast te zitten in de tienerromantiek (hij was 22 toen hij dit nummer schreef) …
Breakin' Up Is Hard To Do - Neil Sedaka

  • En dit is volgens mij zijn beste nummer, “One way ticket“, hier in een minder sterke want te vrolijke live-versie, maar het donkerder origineel (met een fantastische minimalistische banjo-solo) heb ik niet direct op YouTube gevonden:

Vouwfiets plooit te Brussel

Eergisteren avond, bij het naar boven fietsen uit de parkeergarage, plooide mijn vouwfiets waar hij niet zou mogen vouwen; net boven het scharnier van de aluminium stuurstang. Een onzachte en weinig elegante landing op het beton gemaakt, maar daar heb ik gelukkig enkel wat kniepijn aan overgehouden. Of die geplooide fiets nog voor een zacht prijsje te repareren is daarentegen?

de vermoeide stuurstang plooide dicht. of open?detailfoto vermoeide stuurstang

WordPress automagisch upgraden (nu met nog slimmer hondje)

labrador puppyDe meeste nerds/ bloggers weten het ongetwijfeld al; wordpress.org bracht eergisteren versie 2.3 van de gelijknamige open source blogsoftware uit. Wat die nieuwe versie allemaal kan, hebben anderen al beschreven, ga gerust daar even lezen indien ge op zo’n dingen kickt. Via-via kwam ik echter op een pagina van wordpress zelf waarin werd beschreven hoe ge via subversion (ofte svn) bijna automatisch kon updaten. Omdat ik wel van een potje shell-scripten hou en omdat “bijna automatisch” net niet automatisch genoeg is, heb ik WPuppy.sh bij elkaar gekliederd.
Het beestje probeert samengevat het volgende te doen:

  • het haalt van de wordpress svn de pagina waar alle versies opgelijst staan en distilleert daaruit de laatste versie
  • het vergelijkt die versie met de versie die in een config-bestandje opgeslagen zit en vraagt of ge wilt upgraden
  • het upgrade via svn en opent de update.php van uw blog in lynx, zodat wordpress de laatste aanpassingen kan doen
  • het past de versie in het config-bestandje aan

WPuppy.sh hoort vanzelfsprekend in een linux-hok met shell-access en heeft naast bash oa ook lynx en svn nodig om te kunnen spelen. Bij testen heeft WPuppy.sh oa. succesvol een upgrade van WP 2.2 naar 2.3 op mijn Debian Etch machine gedaan, maar ik kan vanzelfsprekend geen garanties geven dat het jonge beest altijd en overal even zindelijk zal zijn 😉
Wie denkt iets met mijn nieuwe speelkameraadje te kunnen doen, moet:

  • WordPress een eerste keer manueel installeren met svn (zoals beschreven op de WP-pagina over svn)
  • WPuppy.sh afhalen in mijn kennel en in een mandje op zijn/ haar linux-gebaseerde server zetten
  • in dat bestand de waarde van variabelen blogdir en blogurl aanpassen
  • in hetzelfde directory een bestand aanmaken met de naam “wp-installedversion” en daarin de huidige versie opslaan in de juiste vorm (bv. “2.2”).

Als ge dat gedaan hebt, zout ge in principe elke upgrade moeten kunnen doen door WPuppy.sh er gewoon op los te laten. Kleine hondjes zijn leuk, toch?
Update: ik heb één en ander aangepast voor eigen gemak en zielerust en WPuppy.sh maakt nu eerst een backup van database en filesysteem en deactiveert daarna ook alle WP-plugins. Fouten allerhande zouden verder iets properder moeten worden opgevangen en gemeld. Maar van de weeromstuit heeft WPuppy.sh nu natuurlijk ook mysql, mysqldump, tar en gzip nodig om te kunnen blaffen. En dat het nu nog meer dan voordien spaghetti-code is, dat spreekt voor zich toch?

Vloeken op Quicktime!

Ik heb vorige week via Apple Software Update Quicktime geüpgrade naar versie 7.2 en heb daar (te) vroeg deze ochtend al veel spijt van gehad. De browser-plugin had alle media-filetypes opgeëist en ik kon mijn wekelijks mp3’ke van de VRT-streamcast-servers enkel nog beluisteren (en niet downloaden) in QT-plugin in mijn browser. In de “file types” configuratie in Firefox was te niet te wijzigen en volgens de QT-instellingen mocht de plugin sowieso geen mp3 opeisen (zoals ik dat ook ooit had ingesteld). Om 7h op een maandagochtend ben ik al eens ongeduldig en ik heb het onding dan ook zonder een seconde te twijfelen gedeïnstalleerd. Kwestie van dat dit “mijn” laptop is en dat ik zelf wel bepaal hoe ik een mp3 beluister, tedoeme!

Search crawlers & cookies?

Vraag voor SEO- en andere search-software-specialisten: hoe gaan search engine crawlers om met cookies? Google beschouwt cookies alleszins als een “fancy feature”, maar het is niet helemaal duidelijk of ze dat nu wel of niet ondersteunen (“search engine spiders may have trouble crawling your site”). En wat doet Nutch bijvoorbeeld?
Ik heb een klein experimentje opgezet. Een stomme pagina zet 4 soorten cookies: een combinatie van session cookies en cookies die expiren na 1 uur met host-afhankelijke en domain-cookies. In de value van die cookies staat mijn naam en het type cookie dat gezet werd. Dat alles serverside, ik ga er immers van uit dat crawlers al helemaal niks kunnen doen met cookies die in javascript worden gezet (of gelezen). Op die setcookie-pagina staat er dan een gewone href-link naar de readcookie pagina, waar al die cookies serverside worden uitgelezen en in gewone html getoond. Crawlers die langskomen, krijgen dus potentieel 4 cookies te verteren en volgen dan mooi de link naar de readcookie-pagina. Als de zoekrobot mijn koekjes gegeten heeft, staat de tekst van die cookies op die 2de pagina en zit die dus ook in de searchindex. Spannend!
Om te besluiten waarmee we ook begonnen waren: heeft er iemand in tussentijd goeie tips of info over dit onderwerp?

Hoe het met “gezocht: search” gaat?

Een tijdje geleden vroeg ik jullie op deze blog naar input over website search oplossingen. Een maand later is een korte update misschien op zijn plaats?
xapian logoLaat ons eerst de oplossingen even overlopen die in de comments van mijn eerdere blogpost werden voorgesteld: pvandewyngaerde linkte naar Xapian en Strigi. Over Strigi kunnen we kort zijn: het is een desktop search en geen website search, volgende dus. De andere link was inderdaad direct veelbelovender: Xapian is een open source search library in c++. Omega is een voorbeeld-implementatie van Xapian in perl. Ik vond niet veel documentatie over Omega, dus even geïnstalleerd en mee gespeeld. Eerste probleem: alle configuratie zit in txt-files, niet van dien aard dat onze business-collega’s daar direct mee aan de slag kunnen. Tweede probleem: crawlen van websites wordt niet ondersteund. Omega gaat er namelijk van uit dat je website lokaal (op dezelfde machine) staat en indexeert statische html via het filesysteem. Voor echte crawling verwijst de wiki naar wget (zo heb je je site toch lokaal) of htdig. Niet handig om het zachtjes uit te drukken en “as such” dus toch niet echt bruikbaar voor onze doeleinden.
lucene logoLuc stelde Nutch voor. Nutch is een broertje van het quasi alomtegenwoordige Lucene; open source, ook onder de rokken van de Apache foundation en ook java. Nutch is een mooi uitgangspunt voor een website search, maar features als stemming en logical operators worden niet ondersteund. Configuratie is heel flexibel (want via tekstfiles), maar er is anderzijds ook hier geen ‘leuke webinterface’ om de boel te administreren. In mijn nota’s (maar ik vind niet direct terug waar ik die info gevonden heb) lees ik tenslotte dat Nutch out of the box geen ‘collections’ ondersteund. Alles wordt dus in 1 index bewaard, wat voor onze implementatie (een 10-tal sites in 2 of 3 talen die we ook apart willen kunnen bevragen) nodig was.
Omdat ik ook maar een onwetend eenzaat in een groot telecom-bedrijf zonder eigen (web-)developers ben, schreven we een tijd geleden ook een paar bedrijven aan met de vraag een oplossing voor ons te formuleren en budgetteren. We kregen 4 nutch logooffertes, 2 voor custom-built solutions en 2 product-gebaseerde voorstellen. De 2 “build” oplossingen gingen beiden uit van Lucene als “core”, de ene met Nutch, de andere met Compas (een high-level api voor Lucene met integratie van Spring, Hibernate, JDBC, …) erbovenop. Omwille van de risico’s verbonden aan custom development (scope-bepaling, functionele analyse en development van de administratie-schermen om er maar enkele te noemen) en omwille van de strikte deadline besloten we om niet te opteren voor nog te ontwikkelen oplossingen.
gast logoDe 2 “buy”-gebaseerde voorstellen lagen betrekkelijk ver uit elkaar; aan de ene kant hadden we Fast, een enterprise search solution die veel meer kan dan website search alleen, maar met een licentieprijs en een doorlooptijd voor installatie en configuratie die natuurlijk navenant waren.
In het andere voorstel kwamen we gelukkig een oude bekende tegen: Searchblox is een op Lucene gebaseerde mid-market search-oplossing. Crawling en indexing, de search-interface (incl. stemming en fuzzy search), een goeie searchblox logobackend voor administratie, een REST-api en de mogelijkheid om met xslt de business logica van de presentatie van zoekresultaten te wijzigen, zijn standaard functionaliteiten die in 1 eenvoudig te deployen WAR zitten. U raadt het al; omwille van doorlooptijd, geboden functionaliteit en kostprijs opteerden we uiteindelijk inderdaad voor Searchblox. Benieuwd wat dat gaat geven!

Het grote Gilles Peterson eerbetoon deel 2

Je hebt zo van die radiomomenten die in het koppeke blijven hangen, zo ook de Worldwide waar ik het vorige vrijdag al over had. In die aflevering van 30 augustus (op Stubru uitgezonden op 2 9 september) zaten oa ook ‘onze’ Zap Mama, Seun Kuti (zoon van) en The Eternals Jimi Tenor (“Tuesday” “Too Many People (Do the Wrong Thing)”, bijzonder maf nummer, niks van terug te vinden op zijn site), maar ook nobele onbekenden als Tawiah (luister naar het prachtige “Every step” op haar MySpace) en Larry Heard met “You Rock Me”.
Van 2 earcatchers vond ik een YouTube-ken, bij deze:
CRS (ofte de nieuwe supergroep van Lupe Fiasco, Kanye West en Pharrell Williams), “US placers”, met een fantastische Thom Yorke-van-Radiohead-sample:

CRS - Us Placers

en Little Dragon (nieuwe groep van Yukimi Nagano, ook gast-zangeres bij Koop) met het herfstig-intimistische goudklompje “Twice”:
Little Dragon - Twice

<edit> Het is ongelofelijk teleurstellend hoe in de comments op “US Placers” rap- en Radiohead-fanboys elkaar in de haren vliegen over hoe fantastisch hun idool wel is en hoe slecht en onbetekenend de andere. Met oogkleppen op zie je nu eenmaal minder. Het is juist de kracht van GP’s Worldwide (en van bv. de programmatie op KCRW, een ander muzikaal fenomeen voor mij) dat die niet bij 1 stijl of bij 1 format blijven plakken.

Futtta’s vrijdagse dansplaat: Roland Appel – Dark Soldier

roland appelAfgelopen zondag is Stubru na een te lange zomer terug begonnen met het uitzenden van Gilles Peterson’s Worldwide. Ik heb de mp3 van die show hier op mijn desktop staan en ik kan U verzekeren, ik heb direct weer bijzonder opwindende muziek gehoord!
Het meest in het hoofd blijven hangen; Roland Appel met “Dark Soldier”, uit op Sonar.
Het is bijna weekend, dus luister maar even naar onderstaande mp3 om alvast een beetje in de mood te komen:
[audio:http://media.sonarkollektiv.com:8000/sonark/DE-P96-07-00098.mp3]