Devven in wat?

Door Y-Less op vrijdag 20 juni 2008 02:25 - Reacties (27)
Categorie: Devven, Views: 2237

Jah ik ben het beu. Stomme Visual Studio 6.0 SP6, is oud, altijd moeite met die klote manifest, 100 wegen naar rome, dan heb je Visual Studio 2008 Professional met 1,2 GB aan MSDN troep waar je niet helder van wordt.

Kortom; Ik ben opzoek naar een moderne leuke dev-taal waar ik mijn programma's in kan schrijven, geen .NET shit, geen VB uit 200 v. Christus.

Iemand een suggestie? :)

Super server geil

Door Y-Less op zaterdag 14 juni 2008 18:25 - Reacties (21)
Categorie: Algemeen, Views: 5877

Hier gaat toch behoorlijk mijn hart van kloppen:


Ziekenhuis

Door Y-Less op zondag 08 juni 2008 02:45 - Reacties (6)
Categorie: Algemeen, Views: 3349

Als klein kind heb ik veel epilepsie. Toch was het gistermiddag na 10 jaar weer eens raak. Een aanval van 18 minuten gevolgt door een onbepaalde tijd in het ziekenhuis. Behalve dat ik me knap beroerd voel mag ik niet roken. Me kamer uit. Of zelfs even een frisse neus halen. Morgen hart filmpje en paar series hersenfoto's. Ik heb al van de dokter gehoort dat ik voorlopig geen auto mag rijden. Wish me luck :-(

'Autonome data-integratie'

Door Y-Less op woensdag 28 mei 2008 17:05 - Reacties (2)
Categorie: Internet, Views: 2135

In deze post laat ik jullie zien hoe makkelijk het is om onzekere data iets autonomer te verdelen, hiervoor gebruik ik de XML structuur (eXtensible Markup Language) zodat ik het voorbeeld van een boomstructuur in XML handig kan uitbeelden.

Een normaal XML document kunnen we namelijk weergeven als een graaf en in de meeste gevallen zelfs als een boom, zie figuur 1;

http://tweakers.net/ext/f/69n5RzQGlErBB8SMdtDcJbWL/full.png


Dit document geeft een adresboek weer met een persoon, Deze persoon heeft een naam en een telefoonnummer, Maar als er twijfel is over een van de eigenschappen van de persoon, bijvoorbeeld het telefoonnummer, dan kan ik dat met normale XML niet weergeven, Daarom zal ik probabilistische xml (pXML) moeten gebruiken en laten we weer hetzelfde adres boek zien, Zie figuur 2;

http://tweakers.net/ext/f/bZuQelZYWMhLMaWKmLe7QqJk/full.png


Nu is het telefoonnummer van John onzeker geworden, Het telefoonnummer is of 1234 (met kans 60%), of 4321 (met kans 40%), De driehoekjes in het model zijn probability nodes en geven aan dat onderliggende nodes, de zogenaamde kinderen, elkaar uitsluiten, Slechts een van die kinderen zal dus echt voorkomen, deze kinderen worden altijd weergeven met open rondjes en worden nader vernoemd als possiblity nodes en hebben een bijbehorende kans, De kansen van possibility nodes tellen altijd op naar één (Verbeter mij hier als ik fout zit).

Een normaal xml document kan dus heel eenvoudig om worden gezet naar probabilistische xml door elke xml node vooraf te laten gaan door een possibility node die weer vooraf wordt gegaan door een probability node.

De mogelijkheid om onzekerheid, en bijbehorende kansen, op te slaan in een document wordt gebruikt om het integreren zo aan te passen dat de gebruiker van de integratie-applicatie niet meer aanwezig hoeft te zijn tijdens de integratie om beslissingen te nemen of twee elementen wel of niet gelijk zijn, Nu zul je denken, Die mogelijkheid moet er dan wel zijn! Om die kans op gelijkheid te bepalen, worden de componenten in de integratie-applicatie verzorgt door "The Oracle", deze krijgt twee elementen als parameters mee en geeft als resultaat een confidence score zodat die twee elementen gelijk kunnen zijn, Met gelijk bedoel ik; óf de elementen refereren aan hetzelfde object, óf dezelfde eigenschap in de echte wereld, Zo zijn de twee xml-boompjes in figuur drie waarschijnlijk gelijk volgens deze beschrijving;

http://tweakers.net/ext/f/LKsYAyZye87jgHKWFDRxk0A0/full.png

In het eerste geval is een telefoonnummer gegeven inclusief netnummer in dit geval dus (053) terwijl in in het tweede geval geen netnummer is gegeven, Bovendien zijn de namen van de nodes in beide bomen verschillend maar betekenen ze wel hetzelfde. Nu heb ik alle benodigdheden om automatische data te gaan integreren, Ik ga er wel vanuit dat het afstemmen van de schema's van verschillende bronnen al is gebeurt, "The Oracle" bekijkt namelijk paarsgewijs alle elementen en slaat het geïntegreerde element, inclusief de confidence score, op.

Nu wil ik als laatste toelichten hoe we nu de integratiestap gaan doen, Het integratie process gebeurt door op elk niveau in de boom een integratiestap uit te voeren.

http://tweakers.net/ext/f/qzopUw8Q4NFmgfvH8JZ8EtLX/full.png


Helaas mis ik wel een onderdeel dat ontbreekt om mijn zogenaamde integratie autonoom te laten verlopen, de mogelijkheid voor gebruikers om feedback te geven op de integratie, Na het stellen van een query aan de database, kan er namelijk antwoord op de feedback gegeven worden, Er zijn twee mogelijke vormen van feedback:
  • Er kan een antwoord worden aangewezen en aangegeven worden dat een antwoord niet correct is, Het resultaat is dat de element verdwijnt uit de database zelf.
  • Een andere vorm wordt gegeven door bij een antwoord juist aan te geven dat dit correct is, Zonder die feedback zou de hoeveelheid onzekerheid na integratie nooit meer kunnen afnemen, maar, door sommige mogelijkheden af te keuren wordt het aantal mogelijkheden en dus ook de daarmee samenhangende onzekerheid kleiner.
Zo, en nu eerst een integratieplan! :Y)

'Downloaden Illegaal?'

Door Y-Less op donderdag 08 mei 2008 02:00 - Reacties (22)
Categorie: Internet, Views: 8529

Nederland is een downloadparadijs. Van onze wetgever mogen we alle muziek en video downloaden en kopiëren, zelfs als de leverancier illegaal opereert. De enige restrictie is dat je de bestanden alleen zelf mag gebruiken.

Vroeger had je MS-DOS, en dat werkte. Dos was ook niet gratis maar diskettes kopiëren kon iedereen. En men deed er weinig aan. Dat is overigens opmerkelijk, illegale software is iets van alle tijden... Net als muziek overigens. Vroeger kocht je LP's of eventueel een cassettebandje. Die LP's waren niet na te maken, maar je kon de handel wel overnemen op een cassettebandje. Radio-uitzendingen idem dito. Wie heeft er niet met een leeg bandje bij de radio gezeten als de mega top 100 uitgezonden werd? Natuurlijk met de lijst uit de krant er naast zodat je wist wanneer je favoriete nummers te horen zouden zijn. Altijd een zemelende presentator door het begin en het einde van je nummer maar wat gaf het. Je kon je muziek later terugluisteren, en daar ging het om, en het kostte, op een bandje en een vrije zaterdagmiddag na, niets.

De CD kwam op. Een afschuwelijk iets. Digitale muziek. Puristen gingen over hun nek. De typische sound van de LP zou het loodje leggen maar het cassettebandje bleef. Als je eenmaal een CD had kon je die oneindig vaak overzetten op bandjes en desnoods dus je muziek delen met vrienden of een kopietje maken voor in de auto. CD's maken was een luxe waar niemand van gehoord had. Heffing op tapes? Niemand wist wat dat was.

De CD-brander kwam op, en ook internet deed zijn intrede. Muziek op de computer zetten werd langzaam aan gemeen goed en zeker toen wave-bestanden overklast werden door MP3 was het leed snel geleden: muziek werd uitstekend overdraagbaar aan anderen ook al hadden ze er niet voor betaald. Zonder hoorbaar kwaliteitsverlies. Waar cassettebandjes een karakteristieke ruis opleverden hoorde je bij een digitaal kopietje niks meer of minder dan op het origineel.

Kopiëren is altijd al gemeengoed geweest en dat is altijd zo gebleven. DRM? Dat slikken consumenten niet. DRM heeft de beste tijd al weer gehad. Kopiëren van muziek is van alle tijden en ik gok dat het dat ook blijft. Alle inspanningen van droginstellingen als Stichting de Thuiskopie en weet ik veel wat ten spijt.

Software dan? Vroeger was het overzichtelijk: je maakte met twee programmeurs op een regenachtige namiddag een spelletje en vervolgens vermaakten hele volksstammen zich er mee. Wie kent Pacman niet? Ik ben zelf ooit begonnen spelletjes te spelen op een tegenhanger van de Commodore 64. Wat je daar voor spelletjes op deed? Dingen die je tegenwoordig al niet eens meer op een GSM vindt.

Daar zit het probleem gelijk ook. Men is verwend tegenwoordig. Alles moet mooier, alles moet dikker en realistischer. Voor een videokaart willen we wel grif centen neertellen (een 8800 GTX voor 500 euro, wil je nog een voorbeeld?) maar games halen we liever van het wijde web. Heb je énig idee hoeveel manuren er tegenwoordig in een spel zitten? Wie beweert er dan nog dat games te duur zijn?

Dat is het hele probleem van software: het is relatief makkelijk te kopiëren en bovendien ziet niemand er de echte waarde van in. De afweging om dan maar alleen gratis software te gebruiken is niet realistisch als kopiëren zo eenvoudig is. Bovendien zijn gratis alternatieven vaak minderwaardig. Commerciële bedrijven kunnen nou eenmaal veel meer investeren in de ontwikkeling van producten. Dat die investeringen op termijn terugverdiend moeten worden leidt tot die hoge prijzen van software.

Een zijspoor: geniaal trouwens dat die software zo hard ontwikkelt. Dan hebben we ook weer een reden om mensen veel te dure hardware aan te smeren. Het toppunt is wel Windows Vista waarvan ik nog steeds niet overtuigd ben. Windows XP functioneert voor de gemiddelde gebruiker nog steeds uitstekend, zelfs op minder krachtige systemen. De komst van weer een nieuw, duur, commercieel pakket van een monopolist is voor de hardwarefabrikanten helemaal niet vervelend. Die wrijven lachend in hun handen.

Die software dus. Open Source is zo gek nog niet, maar mensen willen niet anders zijn dan anderen. Ik heb deze week voor het eerst met Open Office gewerkt. Ik moet zeggen: een prima pakket. Ongelofelijk veel overeenkomst met Office van Microsoft maar juist die kleine verschillen maakt het af en toe tot een hindernisbaan om er mee te werken. Tóch denk ik dat we er eens voor moeten openstaan. Open Source is vaak zo beroerd nog niet. Ik ga het eens proberen.

Nu nog Open Source muziek alstublieft.