Gezocht: website search

We zijn op het werk op zoek naar een nieuwe search-oplossing. De huidige zoek kan enkel content in het eCMS-repository van onze portal ontsluiten. Aangezien verschillende subsites niet meer in die te complexe omgeving zitten, ontbreken er veel relevante resultaten. Daarom zoeken we dus een min of meer kant-en-klare crawler-based oplossing (software of “in asp”) die al onze sites moet indexeren (gescheduled en ‘on demand’) en die, mits aangeroepen met de juiste parameters, resultaten voor 1, enkele of alle sites teruggeeft in de juiste taal en in de juiste look & feel.


Ik bekeek Searchblox (software) en Google Custom Search Business Edition (asp) al, maar ik twijfel er niet aan dat er nog goeie (en misschien wel volledig open source) oplossingen zijn. Wie ervaring met deze of andere producten heeft; de comment box hieronder is all yours, of contacteer me rechtstreeks.

Mijnheer Leterme: wij willen een regering! En goed weer! Nu!

Een paar maanden na de verkiezingen begint het ongeduld (ook in blogland) te groeien. Waar blijft Leterme met zijn regering? Is BHV nu nog altijd niet onverwijld gesplitst? Kan Dehaene anders niet gewoon even terugkomen? En zijn er nog verkoudheden te verwachten ten vakantiehuize Milquet?
De GVA publiceerde eergisteren de resultaten van een peiling onder haar lezers onder de titel “Uw mening: Vlaamse partijen mogen geen toegevingen doen!“. De boodschap van het artikel was duidelijk; de meerderheid van de deelnemers aan de peiling vinden dat Leterme voet bij stuk moet houden en dat de Franstaligen onaanvaardbaar koppig zijn. Blogger Michel Vuijlsteke heeft zo zijn eigen mening over die enquête (waarmee ik het grotendeels eens ben, maar of confederalisme tot separatisme leidt zoals hij in een comment schrijft, daar ben ik helemaal niet zo zeker van) en dat leidde al snel tot een beetje discussie op zijn blog. Ik was daar eerste ongelofelijk flink aan het typen in de comment-box, maar ik wil blog.zog.org niet nodeloos belasten (het gaat daar nu juist wat sneller) en ik besloot mijn mening dus eerder hier te ventileren, een trackback doet de rest wel. Vandaar:
Ik twijfel er niet aan dat Leterme uiteindelijk (eind augustus/ begin september) een regering op de been zal brengen en dat onze Franstalige landgenoten hoe dan ook toegevingen op het vlak van de staatshervorming zullen doen.
Zo, dat hebben we dan ook weeral gehad. Maar daarmee weten we nog niet:

  • welke partijen er in die regering zullen zitten
  • wat de staatshervorming zal inhouden
  • wat het uiteindelijk regeringsakkoord zal betekenen voor de relatie tussen CD&V en N-VA.

En dus keek ik nog wat dieper in de glazen bol:

  • over de regering: “Zie ginds komt Di Rupo uit Bergen weer aan“. Dat betekent vermoedelijk dat MR/FDF gewipt wordt. Milquet zal zich dan misschien ook al wat beter in haar vel voelen. Aan Vlaamse kant blijft Vande Lanotte nog wel even aan zee denk ik, een asymmetrische regering dus?!
  • over de staatshervorming: de splitsing van BHV komt er wel (ze moeten immers iets doen, cfr. het arrest van het Arbitragehof uit 2003 en meer nog omwille van de hoge symboolwaarde van dat dossier) en natuurlijk horen daar compensaties voor die Waalse toegeving bij, want zo gaat dat met onderhandelingen. Ik betwijfel of er voor de rest nog bevoegdheden zullen worden overgeheveld naar de gewesten (enkele symbolische schoonheidsingrepen daargelaten).
  • over de N-VA (en het kartel met de CD&V): “Vlaamse vrienden, laat ons scheiden”? De compromis-staatshervorming zal voor N-VA nooit ver genoeg gaan. Aangezien -volgens mij- aan de andere kant FDF (met de MR) toch van de onderhandelingstafel verdwijnt, zou het evenwicht mooi bewaard blijven en wordt Leterme’s regering er alleen maar stabieler door.

Gerelateerde leuke links om te lezen in afwachting van het uitkomen van deze voorspellingen:

Underworld: born silly?

Een carrière in de muziek kan grillig zijn, dat bewijst het duo achter Underworld al sinds de jaren ’80. In 1983 scoorden Karl Hyde en Rick Smith immers al een eerste hitje. Underworld heette toen wel nog Freur, de single “Doot-doot”. Kijk (en huiver) maar even naar dit tubeken:

Freur - Doot Doot

Gelukkig stopte Freur er in 1986 mee; de Thompson Twins en A Flock of Seagulls hielden wel vol en kijk wat daar van gekomen is. Hyde, Smith en 2 andere Freur-groepsleden brachten 2 jaar later een eerste CD als Underworld (nu gemeenzaam Underworld mk1 genoemd) uit. Hun grootste hit in die incarnatie: “Underneath the Radar”. Opnieuw even meegenieten op YouTube om te merken dat er buiten de naam (en de Midge Ure-styling van Hyde) eigenlijk niet zoveel veranderd was:

Underworld zoals wij ze nu kennen, ontstond in 1991 wanneer de toen 20-jarige DJ Darren Emerson bij de groep kwam en sterke techno- en drum&bass-invloeden meebracht. Hun eerste album als Underworld (versie 2.0), “dubnobasswithmyheadman”, kwam in 1993 uit. De grote doorbraak kwam er in 1996, toen “Born Slippy” (een remix van een nummer uit de eerste CD) één van de meest opvallende nummers op de soundtrack van de cult-film Trainspotting was. De 5 daaropvolgende jaren volgden nog 3 albums en een handvol sterke singles (o.a. Pearl’s Girl, Jumbo, Push Upstairs en King of Snake). Emerson verliet de groep in 2001, waardoor Underworld nu aan versie 3 zit, maar oude knarren Hyde (nu 50) en Smith (toch ook al 48) kunnen het blijkbaar ook zonder Emerson, getuige het mooie “2 Months off” uit 2002:
Underworld - Two Months Off

In oktober mogen we blijkbaar een nieuwe single (“Crocodile”) en CD (“Oblivion with Bells”) verwachten. Maar of we daar met onze oude botten nog voor uit onze zetel gaan komen om houterig te shaken?

Google vs MS: Flight Simulator?

goggles logoEen Google Flight simulator is het nog niet echt, maar wel leuk gevonden; Goggles, een flash spelletje waarmee je over een door Google Maps aangestuurd landschap vliegt. Met een beetje opzoekwerk (en op voorwaarde dat google maps mooie detailbeelden heeft van je omgeving) kun je zelfs over je eigen huis vliegen.
In mijn geval (echt inzoomen op ons huisje in Eksaarde is er niet bij op Google Maps) hou ik het maar op een niet zo willekeurige plek in Brussel in de buurt van de VRT-toren (geen plaats uit de dropdown kiezen, gewoon op ‘start’ klikken). Wie vliegangst heeft en dus snel terug aan de grond wilt, vliegt best naar het noord-oosten, richting Zaventem. Echt landen is -vooralsnog- niet mogelijk, maar je mag ten minste veronderstellen dat de luchthavenbrandweer snel ter plaatse zal zijn …

niet crashen op de binnenplaats, waarvoor dank!

En waar vliegt U naartoe, op deze ietwat druilerige maandagmiddag?

Web 2.0 insecure? Bullshit (of dan toch grotendeels en nu ook met update)!

Op de Black Hat conference in LA werd gedemonstreerd hoe een GMail- of Facebook-sessie kan worden gehackt.


Voor zover ik kan zien, werd hier eigenlijk een wijd open deur ingetrapt; op een (Wifi-)netwerk alle verkeer naar bv. gmail of facebook sniffen, de session-waarde uit de cookie overnemen in de eigen cookie en voor je het weet zit ik in uw mailbox te snuisteren.
Het probleem heeft eigenlijk helemaal niets met web 2.0 te maken, maar gaat over de vreemde beslissing van oa. Google en Facebook (en eigenlijk zie je dat bijna overal) om enkel het login-proces te beveiligen (achter https te zetten). Eenmaal succesvol aangelogd ga je terug naar onbeveiligd verkeer (http zonder de s van secure) en dan is je cookie dus leesbaar voor iedereen die aan je netwerkverkeer kan.
De oplossing voor GMail is alvast eenvoudig: als je als URL zelf https://mail.google.com ingeeft, ben en blijf je in https en is ook je cookie niet meer zomaar te lezen. Ik heb mijn bookmark al aangepast 🙂 Bij Facebook en Linkedin lijkt dat alvast niet te lukken.
Meer info:

Update: ondertussen zit ik op de trein (bovenstaande had ik nog snel-snel op het werk geschreven) en ik heb nu even tijd om wat verder uit te weiden (en open deuren in te trappen) in de vorm van een paar vragen en antwoorden.
V: waarom zijn die (sessies in) cookies nodig?
A: omdat het web (het onderliggende http-protocol) eigenlijk ‘stateless’. Een request (de logon op Facebook bv.) kan aan serverkant enkel aan een volgende request (narcistisch bekijken van je vriendenlijst) gelinkt worden door middel van een sessie. Die sessie wordt geïdentificeerd door een sessionid, die maar op een paar manieren kan worden uitgewisseld; in een cookie, in een url (als parameter in een GET-request) of in een form (als parameter in een POST-request). Van die drie methodes is een cookie ontegensprekelijk de properste, maar qua security zijn ze in principe quasi even (on-)veilig.
V: waarom steken Google en al die andere hot-shots hun applicaties dan niet volledig achter https?
A: de s in https betekent dat alles geëncrypteerd wordt. Encryptie betekent dat de processoren aan ontvangende maar vooral verzendende kant wat meer werk hebben en dat de hoeveelheid data groter wordt (wat een geëncrypteerde tekst bestaat in principe uit meer karakters dan het origineel). Omdat Google, maar meer nog Facebook, Linkedin en andere fancy applicaties gebaat zijn bij het beperken van CPU-load en te versturen data, werken ze dus liever gewoon in http.
V: en kan die sessie dan niet op een andere manier beveiligd worden?
A: in principe wel, maar dan begeeft een developer zich in woelige wateren. Je zou aan serverkant kunnen bijhouden vanop welk ip-adres de gebruiker inlogt (evt. met nog een paar andere parameters zoals useragent van de browser) en dat voor elke request opnieuw controleren. Als een hacker dan met een sessie aan de haal gaat, is de kans groot (maar niet gegarandeerd) dat die parameters niet overeenkomen en dan kun je die malafide gebruiker vragen terug in te loggen. Andere (aanvullende) mogelijkheden zijn het beperken van de geldigheid van een sessie en het afblokken van gelijktijde gebruik van dezelfde login (het gelijktijdig gebruik van dezelfde sessie). Maar met al deze “oplossingen” is de kans groot dat je op bonafide gebruikers zult moeten lastigvallen om terug aan te loggen of zelfs buitensluiten (in het geval van concurrent sessions) . En dat maakt gebruikers zenuwachtig.
Conclusie: er is geen ontkomen aan, je moet https echt vanaf login tot aan de logout gebruiken (en voor alles, ook images in die pagina’s, anders krijg je in sommige browsers lelijke security-warnings). Eén troost: er bestaan hardware-oplossingen (ssl-encryptie devices en insteekkaarten) om de impact op CPU-load tot een minimum te beperken. Met de grotere hoeveelheid dataverkeer zul je dan maar moeten leren leven 🙂

Pinguïn-heuvel te Lokeren?

Gisteren bij het buitenfietsen van het station van Lokeren (aan de achterkant) een bijzonder nieuw verkeersbord gezien;

de Lokerse pinguin-heuvel?
Het bord staat weliswaar ter hoogte van een verkeersdrempel, maar iets zegt me dat die twee niets met elkaar te maken hebben. Ik denk dat dit een pinguïn-heuvel-kampeerplaats moet uitbeelden. Dat is tof van Stad Lokeren (en/of NMBS), want pinguïns op vakantie verdienen het dubbel en dik om goed ontvangen te worden tijdens de Lokerse Feest-week. Zelfs Ludo Gerits moet het hier roerend mee eens zijn, toch?
Of denkt ge dat ik me in mijn interpretatie laat meeslepen, beste lezer? In dat geval; de commentaar-box hieronder is de uwe. Laat U maar eens goed gaan!
(en ja, tip top de verkeerde datum staat verstopt; ik heb mijn Windows Mobile pda moeten ‘cold booten’ en dan verliest die al zijn tijdsbesef. nog flink gevloekt ook toen ik bovenstaande foto gisteravond niet direct terugvond in het op datum gesorteerde verkennertje)

Terug naar de command line!

ms word screenshotMijn echte fans weten het al, ik ben zelfverklaard lid van de Kerk van de Penguïn en aspirant Command Line Ridder. De command line (CLI) is misschien niet de meest vanzelfsprekende user interface, maar het is schier onmogelijk om de ongelofelijke kracht van taal (want daar gaat het op de command line over) om te zetten in een visuele representatie. En het lijkt erop dat taal als ‘aanstuurmechanisme’ aan een comeback toe is!
De kracht van taal
Is het toeval dat de bekendste internet-applicatie (Google eh pippo, niet Second Life) puur op basis van taal werkt? Waarom is desktop search één van de belangrijkste functionaliteiten in Windows Vista (en daarvoor al in Mac OS X Spotlight en in Google Desktop)? Omdat taal een ongelofelijk krachtige manier is om software aan te sturen. Een meer traditioneel CLI voorbeeld misschien nog; om de hostnames van alle unieke bezoekers van deze blog te vinden die mijn babelfish-vertaling-hack gebruiken (en dat zijn er niet bijster veel, waar zijt ge eigenlijk mee bezig Goossens?), plak ik de in- en output van enkele commando’s met een paar pipes aan elkaar tot ik iets als dit heb:

grep babel wwwlogs/e-cafe.be | grep 302 | cut -f 1 -d ” ” | sort | uniq | nslookup – | grep “name = “

Et voila, daar staan ze alle twee. Dat kan natuurlijk ook in een grafische gebruikers omgeving (een GUI), met pakweg MS Excel. Maar daar ben je dan wel echt net iets langer mee bezig (ik tel een 10-tal stappen, van het openen van Excel over het importeren van de data met de wizard en het toepassen van 3 filters tot het scripten van de nslookup).
GUI vs CLI
Maar dit is niet de zoveelste anti-MS blogpost, in Mac OS X en zelfs in al die Linuxen is de grafische user interface ook de de facto omgeving. Shell-scripten (bat-files! cmd.exe!) kan ook in Windows en wat meer is, Microsoft heeft onlangs PowerShell uitgebracht (gratis te downloaden) waarmee ze -in eerste instantie voor sysadmin-taken- volop voor de kracht van de CLI gaan. Nee, het gaat me hier eigenlijk over het feit dat een grafische interface, met die mooie icoontjes en geneste menu’s, in bepaalde gevallen eigenlijk minder gebruiksvriendelijk en productief is. Zoals een niet-grafische interface voor bepaalde taken (bv. het bewerken van foto’s) ook minder geschikt is. En -hier komt mijn langverwachte pointe- dat een hybride vorm van een GUI en een CLI ons op dat vlak misschien de toekomst is.
Best of both worlds
Enter Humanized. Dit klein Amerikaans bedrijf werkt verder op basis van de concepten van de inmiddels overleden Jef Raskin. Raskin was het brein achter de Macintosh en besteedde de laatste jaren van zijn leven o.a. aan Archy, een radicaal andere user interface. Eén van de eerste producten van Humanized, Enso Launcher, brengt een paar van de concepten van Archy nu naar Windows. And I love it!
enso learn as screenshot (from the humanized site)Eenmaal de “30-days free trial version” van Enso Launcher geïnstalleerd, is je shift-lock (ofte caps-lock) weggekaapt door de software (good riddance). Met die toets activeer je vanaf nu Enso om alle software op je computer op te starten door ‘open <programmanaam>’ in te tikken. Enso kent al je software al en zal, aan de hand van de letters die je invult, suggesties doen die je met de cursor-toetsen kunt selecteren (beetje zoals Google Suggest). Maar er is meer; je kunt Enso nieuwe commando’s leren (ik moet bv. enkel “open wr” typen en “write blog” te selecteren om hier te komen schrijven, of “open kcrw” om naar het fantastische kcrw te luisteren), je kunt via Enso een window (of tab in een browservenster) naar voor halen, Enso kan rekenen maken (klinkt stom, maar is eigenlijk best handig), geselecteerde tekst omzetten in lower- of uppercase, copy/pasten, googlen, …
Dat de Launcher maar het tipje van de Enso-ijsberg is, blijkt uit de presentatie die Asa Raskin op de Google campus gaf onder de titel “Death of the desktop”. Wie tijd heeft (het duurt algauw toch een uur en half, maar ) kan die hier bekijken.
Browsers?
mockup of bookmarks and search (from the google labs blog) Wie op de tags bij dit artikel let, heeft misschien al gezien dat ik dit ook onder ‘browser’ heb gecatalogeerd. Waarom? Wel, ik las op de Firefox Labs blog dat men daar overweegt om bijvoorbeeld de search-box op die manier te ontsluiten en om tekst-gebaseerde bookmarking te introduceren. Als ik kijk naar de chaos in mijn diep geneste bookmarks-folder, dan kan ik me het voordeel levendig inbeelden. Dit wordt ongetwijfeld vervolgd!