Wanneer heb je genoeg data?

KAF-submit

Stel, ik heb laatst tien euro uitgegeven aan appels en peren. Appels zijn een euro per stuk en peren zijn twee euro per stuk. Hoeveel appels heb ik dan gekocht? Je weet dat ik er geen elf heb gekocht, tenminste als je gelooft dat ik werkelijk tien euro heb uitgegeven. Je weet ook dat ik een even aantal appels heb gekocht, anders was ik uitgekomen op een oneven bedrag. Het getal ligt dus ergens tussen tien en twee appels. Helaas is dat geen antwoord op mijn vraag.

In deze situatie heb je te maken met onvolledige informatie. Als je wist hoeveel peren ik had gekocht kon je ook iets zeggen over de appels. Dit is een bedachte situatie, maar ook in de werkelijkheid kan dit een groot probleem zijn voor onze kennis. De vraag die er achter schuilt is als volgt: wanneer weten we genoeg over een situatie om onze kennis te waarborgen? Natuurlijk kunnen we doorvragen over de definities van kennis en waarborgen, maar laten we dat voor nu achterwege laten. We hebben een idee over kennis en dat is, voor nu, genoeg. Echter mijn vraag blijft staan, wanneer klopt die kennis?

Gavagai en Quine
Die vraag over appels en peren komt in de realiteit vaker voor dan je denkt. Er is een flinke geschiedenis van scepticisme over de zekerheid van kennis. Descartes hield het voor mogelijk dat een al-wetende demoon ons voor de gek hield. Hume vroeg zich af hoe causatie werkte en of B werkelijk uit A volgde. Allemaal boeiende ideeën, maar ik wil mij richten op Quine.

Quine is een belangrijk filosoof uit de twintigste eeuw die ons wees ons op iets dat ondergedetermineerdheid heet. Stel, we komen een man tegen met een andere afkomst en hij spreekt een taal waar wij niets van weten. Een konijn springt langs en de man wijst ernaar. Daarna zegt hij: ‘Gavagai.’

Dus wat betekent ‘Gavagai’? Instinctief willen we misschien zeggen dat het ‘konijn’ betekent. De man wees tenslotte naar het konijn. Echter, wie zegt dat dit klopt? Het zou kunnen dat de achtergrond van de man heel anders is en dat hij uit een bijgelovige omgeving komt. Het zien van een konijn zou kunnen betekenen dat het gaat regenen vanavond. ‘Gavagai’ zou dus ook ‘het gaat regenen’ kunnen betekenen. Hij zou het ook over een specifiek deel van het konijn kunnen hebben, dat belangrijk is voor hem, om een voor ons onbekende reden. De reden dat wij denken dat hij ‘konijn’ wil zeggen is omdat het voor ons als een logische interpretatie voelt. Die ‘ons’ is essentieel. Wij maken namelijk aannames en interpreteren de data op een manier die afhankelijk is van onze context.

De vraag is nu: wat zei de man? En wanneer weet je zeker wat de man zei? Hoe moet je dit vertalen? Wanneer weet je genoeg? Alle theorieën over ‘Gavagai’ lijken in sommige opzichten equivalent, tenminste als je alleen kijkt naar de data. Je kunt dus niet een theorie kiezen zonder dat daar een aanname achter zit, en die had net zo goed iets anders kunnen zijn. Quine wees ons op een discrepantie tussen theorie en data.

Het probleem is ook niet zomaar opgelost, zelfs niet als je langer praat met de man. Als hij naar andere dingen wijst en andere woorden zegt krijg je misschien een klein handboek vol met woorden, toch biedt niets je zekerheid over de betekenis van die woorden. Het is daarmee vergelijkbaar met mijn vraag: ‘Hoeveel appels heb ik gekocht?’

Geloven in Big Data
Oké, leuk. Fijn dat de filosofie weer een probleem de wereld in heeft geholpen, maar mijn buurman zal niet zomaar in een rare taal gaan praten en wijzen naar konijnen. Bovendien weet ik sommige dingen toch gewoon? Ik weet hoe oud ik ben en waar ik leef. Ik weet hoe ik moet handelen in de meeste situaties. Dus waarom is dit relevant?

Ten eerste moeten we beseffen dat data niet de heilige graal is. We kunnen ons leven niet slechts baseren op data en de statistiek. De befaamde uitspraak: ‘correlatie impliceert geen causatie’ is hier van toepassing. Toch lijken we dat steeds meer te doen. De wereld van AI wordt, momenteel, geregeerd door statistische machines. Machines die dus data gebruiken om te bepalen wat de juiste beslissing is. Big Data, Machine Learning, noem het maar op, al die dingen gaan over het gebruik van data om te bepalen wat de waarheid is, of welke kennis gewaarborgd wordt. Zulke machines proberen dus eigenlijk antwoord te geven op onze vraag over hoeveel appels ik heb gekocht, zonder dat ze weten hoeveel peren ik heb.

Ten tweede moeten we accepteren dat data zelf en dit soort algoritmes nooit in absolute waarheden kunnen spreken. Al deze machines hebben onderliggende aannames en die lijken misschien goed te werken, maar dat is afhankelijk van hoe wij de data hebben verzameld en geïnterpreteerd. Ze zijn getraind op een model dat fundamenteel fout kan zijn. Net als bij ‘Gavagai’ weten ze echter niet de achterliggende realiteit. Dit is een beangstigend idee, want we raken steeds meer gebonden aan zulke machines. Alle Big Tech is afhankelijk van zulke modellen en datasets, dus willen we het erop wagen dat ze fout zitten?

Met dat in ons achterhoofd zie ik twee wegen. Afstand doen van de statistiek, óf de discrepantie tussen de data en theorie begrijpbaar maken. Persoonlijk ben ik voor de eerste weg, maar ik zie ook in dat de kans dat zoiets radicaals gebeurt extreem onwaarschijnlijk is. In het tweede geval zal Machine Learning nuttig blijven, maar moet er wel een addendum bij: we moeten duidelijk maken dat de machine slechts een van de vele mogelijke modellen heeft geleerd dat de realiteit kan verklaren.

Dit item is geschreven door Sietze van schrijverscollectief Kaf.

maandag 14 oktober 2019, 01:44 uur #1

Jouska

FKAN

Waar aan dit verhaal ontbreekt is: over welke stelling hebben we het?
Schrijver lijkt ergens een probleem mee te hebben. Ergens een mening over te hebben. En ik heb geen flauw idee waar de schrijven het over heeft.

Heeft schrijver er problemen mee dat bedrijven modellen/AI in het leven roepen om geld te verdienen?
Of heeft de schrijver er problemen mee dat AI straks gaat bepalen wat we doen uit sociaal oogpunt?

Ik kan helemaal niks met dit stuk als ik niet weet wat het probleem is van de schrijver.
Is ie boos? Waarop dan? Is ie bang? Waarvoor?

Is dit financieel bedoeld? Spiritueel bedoeld?
Serieus... waar gaat dit over? Missen we het 1e hoofdstuk of zo?

maandag 14 oktober 2019, 02:24 uur #2

zetalore

Ik begrijp de schrijver heel goed, het gaat hier om waarheids vinding. En het dilemma van 'hoe' weten wij dat onze ideeen in ons brein daadwerkelijk overeen komen met de waarheid.

Hier is echter wel een oplossing voor. Neem de volgende 3 dingen

Perspectief.
Mechanisme.
En en Rubiks kubus.

Het mechanisme binnen de Rubiks kubus blijft altijd hetzelfde. De oppervlakte kan echter door de bewegingen van deze kubus veranderen. En hoe jij deze veranderingen ervaart wordt bepaalt door je perspectief.

1+1=2 , of je nu 10 of 10 miljard jaar verder bent, dat hindert niet. Het mechanisme blijft hetzelfde binnen de Rubiks kubus. De oppervlakte van de Rubiks kubus met de kleurtjes kan echter veranderen, je kan het over appels hebben, peren of wat dan ook. Maar ongeacht of je wel of niet het kennis perspectief hebt op de situatie, het wiskundige mechanisme blijft hetzelfde. Puur omdat jij niet weet wat de waarheid is, betekent niet dat het wiskundige systeem achter dit mechanisme niet klopt. Jij weet misschien niet waar de kleurtjes zitten op de Rubiks kubus, maar iemand dit ze wel weet kan de kubus weer terug herleiden naar de originele staat.

Misschien kun je je nog een oude opgave uit je wiskunde boek herinneren. Je krijgt een formule voor je neus,
bijvoorbeeld Pyhtagoras a2 + b2 = c2 , dan moet uit de opgave minimaal 2 gegevens bekend zijn om de derde uit te rekenen. Is geen enkel gegeven bekend, dan kun je de opgave niet oplossen, maar dat betekent niet dat de stelling van Pythagoras niet klopt. Je bent dan simpelweg onwetend.

Met andere woorden, wil je wel zeker weten wat de waarheid is, dan moet je volledig op de hoogte zijn van de wiskundige waarheid. En als je deze gegevens test tegen de realiteit, en deze komen functioneel overeen, dan kun je er zeker van zijn dat dit klopt.

maandag 14 oktober 2019, 04:29 uur #3

Averni

quote:
Ten eerste moeten we beseffen dat data niet de heilige graal is.

Het levert geld op. Leuk stukkie, maar daar ga je beetje mank.

quote:
De befaamde uitspraak: 'correlatie impliceert geen causatie' is hier van toepassing. Toch lijken we dat steeds meer te doen. De wereld van AI wordt, momenteel, geregeerd door statistische machines.

Des te meer data, des te beter het model. Weer zo'n kleinigheidje

Ander kleinigheidje is dat "big data" niet enkel bij AI gebruikt wordt.

quote:
óf de discrepantie tussen de data en theorie begrijpbaar maken.

Dat verschil is ons al duidelijk, alleen niet waarom jij hier een beetje zit te zeuren erover. Het gros van het volk werkt er niet mee, en hoeft dat verschil dus niet eens te kennen.

maandag 14 oktober 2019, 04:31 uur #4

quote:
Op maandag 14 oktober 2019 @ 02:24 schreef zetalore het volgende:
Ik begrijp de schrijver heel goed, het gaat hier om waarheids vinding.

[..]

Met andere woorden, wil je wel zeker weten wat de waarheid is, dan moet je volledig op de hoogte zijn van de wiskundige waarheid. En als je deze gegevens test tegen de realiteit, en deze komen functioneel overeen, dan kun je er zeker van zijn dat dit klopt.

We hebben geen absolute waarheden nodig om de wereld te modelleren. Je harses interpreteren de zintuigen continu, en updaten je wereldbeeld continu. Dat deden ze al toen onze waarheid bestond uit het doodknuppelen van Neanderthalers.

maandag 14 oktober 2019, 04:38 uur #5

koffiegast

langzinnig

Het verhaal doet me denken aan hetgeen wat men in de AI kent als "Symbol grounding". Lees maar eens over de Chinese Room. Dit is een uitdaging voor computers, maar voor mensen net zo. Ik heb eigen ervaringen waarin ik dacht te begrijpen wat men bedoelde op basis van de symbolen en aanwijzingen, maar de daadwerkelijke betekenis was iets anders.

Redactie Frontpage

maandag 14 oktober 2019, 06:32 uur #6

harry64

Ouwe Radiopiraat

Het gaat niet om absolute aantallen. De AI heeft er genoeg aan om te 'weten' dat zowel appels als peren gekocht zijn en dat jij bereidt bent om voor -fruit- 10 euro uit te geven. Vervolgens is er de afweging wat met deze 'kennis' over jouw patroon te doen.

Er 'niets' mee doen is geen optie want dan zou het verzamelen van die data zinloos zijn. Dus gaat de verkoop-AI je media die je gebruikt vullen met van alles over ~~appels en peren~~ fruit. Echter de NSA/AIVD-AI zal bij een aanslag met rot ~~peren en appels~~ fruit ook een vinkje achter je ID zetten.

Dat je overal reclames en recepten ziet voor ~~appels en peren~~ fruit ervaar je misschien als helpend, als je zonder een spat bewijs van je bed gelicht wordt na een aanslag met rot fruit wat minder.

Verder zie ik AI als de volgende stap in het evolutieproces dat al sinds het begin der tijden gaande is. Je ontkomt er uiteindelijk niet meer aan omdat het overal in je dagelijks leven wordt toegepast. Het zit nu al in je smartfoon, auto, tv, koelkast, wasmachine, verlichting enz. Je ziet ook dat het beestje mens steeds 'dommer' wordt en afhankelijker van de techniek. Uiteindelijk kunnen we niets meer zelf bedenken omdat het menselijke brein net als de blinde darm een ongebruikt orgaan zal worden.

[ Bericht gewijzigd door harry64 op maandag 14 oktober 2019 @ 08:06 ]

Radio Seabreeze 1098KHz(Laren) en 1395KHz(Grou) Middengolf
MCB radio 747KHz Middengolf

maandag 14 oktober 2019, 06:52 uur #7

Loei

Errug leuke materie!

foto

maandag 14 oktober 2019, 06:56 uur #8

quote:
Op maandag 14 oktober 2019 @ 06:52 schreef Loei het volgende:
Errug leuke materie!

[ afbeelding | link ]

Ja, wat moeten we nu eens gaan verbieden om het 'veiliger' te maken, lakens of kaas.

maandag 14 oktober 2019, 07:51 uur #9

foton

__--*--__

Als je denkt dat statistiek eenduidige antwoorden geeft, dan heb je er niks van begrepen.
Terug naar Statistics 101!

maandag 14 oktober 2019, 08:23 uur #10

Multani

Dit is eigenlijk meer een voorbeeld van hoe je mensen kunt belazeren met grafieken. Zo groot is die correlatie namelijk niet, het aantal doden is verdubbeld terwijl de kaasconsumptie maar met 10% is toegenomen.

Shine on forever, shine on, benevolent sun

maandag 14 oktober 2019, 08:42 uur #11

TjerkdeVries

Eerst schrijf je met veel woorden dat één (1) interactie onvoldoende gegevens biedt om iets zeker te weten. Voor veel vragen is dat inderdaad correct.

Waarom moet iets 100% juist zijn om werkbare resultaten te geven? Het leven is niet zwart wit.

Echter je initiële vraag houdt stand. De grap is dat het gebruiken van BigData een bijna onbeperkte hoeveelheid data in allerlei vergelijkbare en afwijkende combinaties samenbrengt. Door die onderling te classificeren en afweegt kom je tot een optimaal inzicht. Juist door het gebruik van Bigdata kom je heel dichtbij een nette benadering van 100% overzicht. Je applicatie doorziet verbanden die je als mens nooit gaat herkennen.

Sterker nog, het geeft reeds betrouwbare antwoorden op vragen die nog gesteld moeten worden. Nu de vragen en toepassingen bedenken...

Het gebruik van BigData is een gevolg uit de vraag naar betrouwbare antwoorden.

For each contact, there is a solution!
The person most likely stopping you, is you.

maandag 14 oktober 2019, 08:42 uur #12

Kumerian

quote:
Op maandag 14 oktober 2019 @ 04:29 schreef Averni het volgende:
Des te meer data, des te beter het model. Weer zo'n kleinigheidje

Je model is echter gebasseerd op aannames. Als je aannames onjuist zijn kan je model nog zo goed zijn, het zal nooit tot iets nuttigs lijden.

Hoewel het taal voorbeeld van de poster wel compleet mank gaat wanneer je een schier oneindige bak data hebt. Door iedere 'Gavagai' uitspraak in context te zetten en de overeenkomsten tussen de context te vinden kun je de betekenis van het woord achterhalen. In dat geval doe je dus slechts de aanname dat het uitspreken van het woord context gevoelig is. Het machine-leesbaar maken van je data wordt erg lastig maar meneer Ockam zegt dat dit uiteindelijk tot een zinnig resultaat zal leiden.

maandag 14 oktober 2019, 09:04 uur #13

BattleX

quote:
Op maandag 14 oktober 2019 @ 08:23 schreef Multani het volgende:

[..]
Dit is eigenlijk meer een voorbeeld van hoe je mensen kunt belazeren met grafieken. Zo groot is die correlatie namelijk niet, het aantal doden is verdubbeld terwijl de kaasconsumptie maar met 10% is toegenomen.

Juist daarom!

Verbied kaas!

maandag 14 oktober 2019, 09:35 uur #14

gombro

quote:
Alle Big Tech is afhankelijk van zulke modellen en datasets, dus willen we het erop wagen dat ze fout zitten? Met dat in ons achterhoofd zie ik twee wegen. Afstand doen van de statistiek, óf de discrepantie tussen de data en theorie begrijpbaar maken.

Maar wat we momenteel doen is een derde weg: ervan uitgaan dat de hele mensheid die werkhypothese hanteert, zoals ook de hele mensheid er al duizenden jaren van uitgaat dat niet alleen 'gavagai' waarschijnlijk konijn zal betekenen, maar dat ook 'konijn' voor mij hetzelfde betekent als voor mijn dochter. Quod non natuurlijk: mijn dochter denkt aan haar lieve knuffeltje, ik aan een stoofschotel.

Het is dus op het laagste niveau al mis, ook binnen mijzelf. Maar als die hele mensheid aan diezelfde denkfout lijdt en discrepantie riskeert, what the hell? De Chinezen gebruiken de digitale verworvenheden om burgers te filmen en gezagsgetrouwheid te belonen in een puntensysteem. Wij veroordelen dat, maar we snappen wel wat er gebeurt: er worden modellen en datasets gebruikt waarin 'gavagai' namelijk ook vermoedelijk konijn betekent. En niet iets totaal onbegrijpelijks.

De hele mensheid zit in dat schuitje en waagt het erop dat het collectief op foute koers zit. Zolang het niet zinkt is er niks aan de hand. We wagen het er dus op.

maandag 14 oktober 2019, 10:12 uur #15

andrew.koster

De tering. Als de kaasconsumptie was verdubbeld, was her aantal doden door lakens dus vertienvoudigd! Veel efficienter dus om kaas te verbieden dan lakens!

PS: je snapt niet wat correlatie betekent en hoe het wordt berekend. Misschien dus ff terug naar je intro statistiek klas.

maandag 14 oktober 2019, 10:19 uur #16

quote:
Op maandag 14 oktober 2019 @ 10:12 schreef andrew.koster het volgende:

[..]

De tering. Als de kaasconsumptie was verdubbeld, was her aantal doden door lakens dus vertienvoudigd! Veel efficienter dus om kaas te verbieden dan lakens!

PS: je snapt niet wat correlatie betekent en hoe het wordt berekend. Misschien dus ff terug naar je intro statistiek klas.

Ik denk dat dat laatste overbodig is, wat ik bedoel te zeggen is dat het lijkt of de twee lijnen min of meer gelijk stijgen doordat de schalen zijn gemanipuleerd. Maar kijk je beter dan zie je in sommige tijdvakken zelfs tegengestelde trends, bv tussen 2004 en 2005 en 2007-2009. Maar goed om de correlatie echt te kunnen zien moet je sowieso de paren tegen elkaar plotten en niet beide trends tegen de tijd. Dan zou je alle punten van de kaasconsumptie gegroepeerd zien liggen en het aantal doden zien variëren.

maandag 14 oktober 2019, 10:56 uur #17

blieb

Mooi stukje, fijn voor bij de tweede bak koffie vandaag. Bedankt.

Mijn wiskundeleraar leerde ons vroeger: durf te vragen "waarom" en "bewijs het maar". Misschien wel het belangrijkste dat hij ons heeft geleerd. Want ik ben anders gaan kijken naar opmerkingen als "cijfers bewijzen dat...". Want diezelfde cijfers bewijzen vaak ook exact het omgekeerde. Of de conclusies over die cijfers zijn op zijn zachtst gezegd, vaak enorm twijfelachtig.

En dan kijk ik naar de redactiesommen van mijn kind. Soms wordt er van een vooronderstelling uitgegaan - dat dit ondergedetermineerdheid heet weet ik sinds dit stukje. Kijk je goed naar die som, dan zijn er stomweg veel meer uitkomsten mogelijk. Een van die uitkomsten staat tussen de multiple-choice antwoorden - maar dan moet het kind dus net zo lang correcte uitkomsten ophoesten totdat er eentje voorbij komt die overeenkomt met een multiple-choice antwoord. Voor hoogbegaafde kinderen een hel. Voor de wat minder begaafde kinderen niet want die gaan mee in de verzwegen vooronderstelling. Een hoogbegaafde zet vaak vraagtekens bij zo'n vooronderstelling en gaat eraan voorbij, zo'n hoogbegaafde moet je echt leren "wat denk jij dat de maker van die opgave nou bedoelde? Wat denk jij dat het meest voor de handliggende antwoord is, ook al zijn er nog veel andere antwoorden mogelijk? En daarmee daag je de hoogbegaafde uit om even verder te denken en voorkom je de frustratie.

Voorbeeld: Jan heeft € 10 in zijn beurs. Hij koopt 2 boeken van € 3,55. Hoeveel munten van € 0,50 krijgt hij terug? Volgens de redactiesommen is het enige juiste antwoord 5. In werkelijkheid is juiste antwoord hooguit 5. Een betere vraag zou zijn geweest: Hoeveel munten van € 0,50 krijgt Jan hooguit terug?

De som bij de redactiesommen was iets ingewikkelder. Heb die even niet paraat. Maar dit was wel de strekking.

maandag 14 oktober 2019, 13:18 uur #18

quote:
Op maandag 14 oktober 2019 @ 08:42 schreef Kumerian het volgende:

[..]

Je model is echter gebasseerd op aannames. Als je aannames onjuist zijn kan je model nog zo goed zijn, het zal nooit tot iets nuttigs lijden.

Nee, het model wordt gebaseerd op historische data.

quote:
Het machine-leesbaar maken van je data wordt erg lastig maar meneer Ockam zegt dat dit uiteindelijk tot een zinnig resultaat zal leiden.

Onzin.

maandag 14 oktober 2019, 17:08 uur #19

Ouwehoersubsidie

Gematigd fascist

quote:
Op maandag 14 oktober 2019 @ 01:44 schreef Jouska het volgende:
Waar aan dit verhaal ontbreekt is: over welke stelling hebben we het?
Schrijver lijkt ergens een probleem mee te hebben. Ergens een mening over te hebben. En ik heb geen flauw idee waar de schrijven het over heeft.

Heeft schrijver er problemen mee dat bedrijven modellen/AI in het leven roepen om geld te verdienen?
Of heeft de schrijver er problemen mee dat AI straks gaat bepalen wat we doen uit sociaal oogpunt?

Ik kan helemaal niks met dit stuk als ik niet weet wat het probleem is van de schrijver.
Is ie boos? Waarop dan? Is ie bang? Waarvoor?

Is dit financieel bedoeld? Spiritueel bedoeld?
Serieus... waar gaat dit over? Missen we het 1e hoofdstuk of zo?

Ik denk dat de schrijver iets teveel flessen champagne op had

maandag 14 oktober 2019, 20:35 uur #20

Xili0n

It takes two, to tango :)

Lekker met termen gooien vinden we allemaal leuk. Laat ook zien dat je ooit een boek hebt gelezen of goed hebt opgelet in de schoolbank.

Prachtig.

Maar wat is nou het doel van dit stuk? Pronken met wat kennis? Iets anders haal ik er niet uit...

Het enige waar het enigzins tot een kern komt is bij het stukje over data. En laat dat deel nou juist nergens op slaan. Data is data; dat wordt pas interessant als we er informatie van maken. Tot die tijd is 'data' net zo ongrijpelijk als 'Gavagai'.
AI probeert ook niet een waarheid te schetsen in data, maar eerder informatie te tonen die er eerder misschien niet makkelijk uit te halen was. Wat die informatie vervolgens voor nut heeft, is niet aan AI, maar aan de mens. AI schetst bijvoorbeeld verbanden; maar alleen omdat wij aangegeven hebben te willen zien òf er verbanden zijn. AI 'doet' niets; Machine Learning is oliedom als wij niet aangeven wat wij willen. En àls er dan al een verband aangetoond wordt, is het nog aan de data scientist, de wetenschapper, de gebruiker, om de causaliteit erbij te pakken.

Daarmee valt de conclusie weg, en is het hele stuk niets meer als... jawel... Gavagai.

I tried to sniff coke once... but the icecubes got stuck up my nose :-/

maandag 14 oktober 2019, 20:55 uur #21

quote:
Op maandag 14 oktober 2019 @ 20:35 schreef Xili0n het volgende:
Maar wat is nou het doel van dit stuk? Pronken met wat kennis? Iets anders haal ik er niet uit...

Goh, ik ervaar dat heel anders. Namelijk als een heel zorgvuldig, uit wellicht jaren toewijding gecondenseerde essentie. Dat die kern met succes in Jip-en-Janneke-taal over te brengen is, zegt veel over de universaliteit ervan. Het thema blijft mij de hele dag al kietelen. Omdat het ook tot zelfonderzoek en conclusies over mezelf leidt.

maandag 14 oktober 2019, 22:19 uur #22

Bornfree

Interessant stuk. Mensen die zich druk maken om AI zijn angstkonijnen, je kunt ze er beter niet bij hebben maar ze schijnen zich voort te planten als......Juist ja. De door de mens geïnterpreteerde data is wat mij betreft geen ruwe data ik denk dat geïnterpreteerde data vervuilend werkt voor de uiteindelijke interpretatie, cq. uitkomst, van AI m.a.w. de algoritmes. Waar velen mee zitten is de uitkomst van de algoritmes en wat het grote AI brein ermee 'kan doen'. besluit het energiecentrales plat te leggen omdat de uitstoot CO2 van boerenbedrijven te hoog vindt en het AI brein zo geprogrammeerd dat het 'het beste met de mensheid voor moet hebben'. Dus wat mij betreft is het 'kan doen' wel het belangrijkste wat het 'niet moet kunnen'....

dinsdag 15 oktober 2019, 09:47 uur #23

quote:
Op maandag 14 oktober 2019 @ 13:18 schreef Averni het volgende:
Nee, het model wordt gebaseerd op historische data.

Ik zou zeggen; lees het stuk nog eens. Er is geen historische data. Baseer je model op historische data en je bent expliciete aannames aan het doen. Je doet op zijn minst de aanname dat historische data vergelijkbaar is met wat je nu wilt doen.....

quote:
Onzin.

Goed onderbouwd joh.

dinsdag 15 oktober 2019, 14:02 uur #24

quote:
Op dinsdag 15 oktober 2019 @ 09:47 schreef Kumerian het volgende:

[..]

Ik zou zeggen; lees het stuk nog eens. Er is geen historische data. Baseer je model op historische data en je bent expliciete aannames aan het doen. Je doet op zijn minst de aanname dat historische data vergelijkbaar is met wat je nu wilt doen.....

Het KNMI spaart al meer dan honderd jaar temperatuur-metingen door het hele land. Dat is een hele berg data - die berg data geeft inzicht in weerpatronen en kun je dus gebruiken voor voorspellingen. Als je absolute waarheden zoekt, dan is deze realiteit niets voor jou; maar zeelui begrijpen allemaal dat het geen beloftes zijn en dat het weer inherent onvoorspelbaar is. Dat maakt de voorspelling echter niet minder waardevol.

Op diezelfde manier modelleren we dingen zoals koopgedrag, en hoewel mijn aanname over jouw specifiek koopgedrag in de machine misschien fout is, de trends en tendensen zijn "best wel waardevol".

Zelfrijdende auto's zullen ook een plaats krijgen in de maatschappij, en rondrijden ondersteund door deels foutieve aannames, maar ook deels door foute correlaties. Toch zal dat in de praktijk niets uitmaken, omdat het model dan goed genoeg past bij de realiteit om praktisch nut te hebben.

woensdag 16 oktober 2019, 01:38 uur #25

quote:
Op maandag 14 oktober 2019 @ 20:55 schreef gombro het volgende:

[..]

Goh, ik ervaar dat heel anders. Namelijk als een heel zorgvuldig, uit wellicht jaren toewijding gecondenseerde essentie. Dat die kern met succes in Jip-en-Janneke-taal over te brengen is, zegt veel over de universaliteit ervan. Het thema blijft mij de hele dag al kietelen. Omdat het ook tot zelfonderzoek en conclusies over mezelf leidt.

Grappig. Ik werk namelijk in dit wereldje en wilde eigenlijk gewoon 'bullshit' roepen, maar dat zou iets te kort door de bocht zijn.
Met mijn jarenlange toewijding en ervaring kan ik namelijk met redelijke zekerheid zeggen dat dit stuk een paar knipsels zijn van wat onderwerpen die totaal onsamenhangend bij elkaar zijn geveegd, en dan ook nog eens naast de waarheid zitten mbt het onderwerp data.

.. maar inderdaad, de ervaring van de lezer zal verschillen per persoon.

woensdag 16 oktober 2019, 07:46 uur #26

quote:
Op woensdag 16 oktober 2019 @ 01:38 schreef Xili0n het volgende:

Grappig. Ik werk namelijk in dit wereldje

Je bent ook neurowetenschapper? Of bedoel je dat je de hele dag (en nacht kennelijk) achter een monitor zit.

vrijdag 18 oktober 2019, 09:21 uur #27

quote:
Op dinsdag 15 oktober 2019 @ 14:02 schreef Averni het volgende:

[..]
Het KNMI spaart al meer dan honderd jaar temperatuur-metingen door het hele land. Dat is een hele berg data - die berg data geeft inzicht in weerpatronen en kun je dus gebruiken voor voorspellingen. Als je absolute waarheden zoekt, dan is deze realiteit niets voor jou; maar zeelui begrijpen allemaal dat het geen beloftes zijn en dat het weer inherent onvoorspelbaar is. Dat maakt de voorspelling echter niet minder waardevol.

Op diezelfde manier modelleren we dingen zoals koopgedrag, en hoewel mijn aanname over jouw specifiek koopgedrag in de machine misschien fout is, de trends en tendensen zijn "best wel waardevol".

Zelfrijdende auto's zullen ook een plaats krijgen in de maatschappij, en rondrijden ondersteund door deels foutieve aannames, maar ook deels door foute correlaties. Toch zal dat in de praktijk niets uitmaken, omdat het model dan goed genoeg past bij de realiteit om praktisch nut te hebben.

Cool story bro.
Heeft echter geen enkel raakvlak met deze column of de reactie die ik daarop gaf.....
Statement blijft dus: Er is geen historische data.

Wanneer jij nu een marsmannetje tegen zou komen die naar een konijn wijst en zegt "Gavagai" dan heb je helemaal niets aan al je historische data en is je enige optie dus een aanname te doen. Zelfs al laat je dat marsmannetje honderden, duizenden, honderdduizenden dingen zeggen dan nog heb je alleen maar aannames en helemaal niets meer dan dat.

zaterdag 19 oktober 2019, 01:36 uur #28

quote:
Op woensdag 16 oktober 2019 @ 07:46 schreef gombro het volgende:

[..]

Je bent ook neurowetenschapper? Of bedoel je dat je de hele dag (en nacht kennelijk) achter een monitor zit.

Leuke poging om grappig te zijn.. maar er zijn nog andere vakgebieden die met data om gaan, zoals AI Engineer, data scientist, en content management specialist.

En wat doe jij? Middelbare school met praktijkgerichte invulling?

Reageer zelf

Om te kunnen reageren moet je zijn ingelogd op FOK.nl. Als je nog geen account hebt kun je gratis een FOK!account aanmaken

28 reacties