Serie: Zin en onzin van numerieke analyse in de archeologie
Deel 1
Onlangs kregen we een vraag ; ‘Welke invalshoek is optimaal om overeenkomsten en verschillen waar te nemen?’. Het ging over paaltjes. Maar het had dus net zo goed over scherven kunnen gaan… U kunt er voor kiezen dat nu eerst te lezen (klik hier!), maar het kan ook later…
Deze keer gaan we het hebben over het sorteren van blokjes. Een simpel blokje heeft een hoogte, een breedte en een lengte. Jazeker, het heeft nog veel meer eigenschappen, maar laten we het voor het voorbeeld hier even bij houden. We beginnen eenvoudig…
Eén dimensie: Lengte
Voor we met de blokken gaan spelen – die drie dimensies hebben: Lengte, breedte en hoogte – pakken we eerst één dimensie, laten we zeggen de lengte. Die drukken we uit in een lengtemaat, en laten we daar eens [cm] voor nemen…
Stel je voor dat we een stel lengtes hebben, laten we zeggen 25 lengtes, en die lengtes zijn volkomen willekeurig. Om de lengtes uit elkaar te kunnen houden plakken we er een labeltje op, in dit geval de letters a tot en met y.
Dat ziet er dan zò uit:

Wàt een rommeltje! Maar daar wat orde in scheppen lukt nog wel. Wat heen en weer schuiven en kijk eens aan:

Dat ziet er al veel beter uit!…
Merk op dat er toevallig een aantal dezelfde lengtes in de set gegevens zitten (drie paar) …
Twee dimensies: Lengte en Breedte
We gaan een stapje verder. We houden de lengtes, en doen daar al tweede dimensie net zo’n set breedtes bij. We hebben nu dus een set rechthoekige Oppervlakken (=lengtes x breedtes)…

De ellende wordt dus alsmaar groter: Wat nu? Hoe krijgen we orde in de hut? Je zou bijvoorbeeld kunnen denken ‘nou, dan maar de oppervlakte uitrekenen en die sorteren…. Ik weet niet of die uitkomst echt bevredigend is, zie hieronder;


Niet echt geweldig… weliswaar naar de grootte van oppervlakte gesorteerd, maar de lengte-breedte verhouding (de zogenaamde ‘aspect-ratio’) is een zootje…
Dan maar op een X-Y grafiek, met op X de lengte, en op Y de breedte?

We verzinnen een list: Als we nu eens proberen te kijken naar de verhouding tussen lengte en breedte – die zogenaamde ‘aspect-ratio’ – die de vorm van de rechthoek bepaald?
Nou, dan krijgen we wel de vorm van het oppervlak, van bijna vierkant ( Lengte/Breedte bijna 1 tot en met een zeer langwerpig oppervlak (Lengte/Breedte bijna 7,5). Maar als we die volgorde aanhouden, zien we dat de grootte van die oppervlakken totaal door elkaar lopen…

Tsja, kennelijk hadden we de reeks nu graag gesorteerd op zowel grootte als Lengte-Breedte verhouding (‘vorm’).

Op de verticale as, de Y-as zien we de vorm van vierkant (L/B=1) tot zeer langwerpig (L/B=8). Op de horizontale as, de X-as zien we de grootte van het oppervlak. We hebben nu dus de vorm tegen de grootte uitgezet. 🤔Dit geeft ons het beste overzicht wat we kunnen verzinnen op dit moment.
👨🎓 Merk op dat we nu dus op een andere manier naar de oppervlakken kijken: niet in termen van lengte en breedte, maar langs andere assen, te weten LxB en L/B. Kortom, we hebben een andere positie ingenomen ten opzichte van de dimensies van de ‘objecten’, de oppervlakken (a) t.m. (y).
We hebben nu nog maar twee dimensies, en zitten dus meteen al aardig in de puree 😯😦😨😰🥵
Goed, goed, het is een begin. We gaan het nu nog een graadje moeilijker maken. …
Drie dimensies: Lengte, Breedte en Hoogte
Neem nu even een set van 25 blokjes die dus een volkomen willekeurige hoogte, breedte en lengte hebben, dus drie dimensies. Dat zou er bijvoorbeeld zo uit kunnen zien:

We kunnen op basis van de drie dimensies (hoogte, breedte en lengte) nog een aantal andere kengetallen bepalen. Bijvoorbeeld de inhoud …
De 25 blokjes hebben de identificatiecode: a – y
De kengetallen zijn de volgende:
X1, X2, X3 = Lange as, tussenliggende as, korte as (~ analoog aan lengte, breedte, hoogte)
X4 = langste diagonaal,
X5 = verhouding (straal kleinste omschreven bol/straal grootste ingeschreven bol)
X6 = verhouding ((lange as + tussenliggende as)/korte as)
X7 = verhouding (oppervlakte/volume)
We merken op dat we dus niet drie, maar zeven eigenschappen hebben …
Tabel 6.18 | X1 | X2 | X3 | X4 | X5 | X6 | X7 |
a | 3,760 | 3,660 | 0,540 | 5,275 | 9,768 | 13,741 | 4,782 |
b | 8,590 | 4,990 | 1,340 | 10,022 | 7,500 | 10,162 | 2,13 |
c | 6,220 | 6,140 | 4,520 | 9,842 | 2,175 | 2,732 | 1,09 |
d | 7,570 | 7,280 | 7,070 | 12,662 | 1,791 | 2,101 | 0,822 |
e | 9,030 | 7,080 | 2,590 | 11,762 | 4,539 | 6,217 | 1,276 |
f | 5,510 | 3,980 | 1,300 | 6,924 | 5,326 | 7,304 | 2,403 |
g | 3,270 | 0,620 | 0,440 | 3,357 | 7,629 | 8,838 | 8,389 |
h | 8,740 | 7,000 | 3,310 | 11,675 | 3,529 | 4,757 | 1,119 |
i | 9,640 | 9,490 | 1,030 | 13,567 | 13,133 | 18,519 | 2,354 |
j | 9,730 | 1,330 | 1,000 | 9,871 | 9,971 | 11,064 | 3,704 |
k | 8,590 | 2,980 | 1,170 | 9,170 | 7,851 | 9,909 | 2,616 |
l | 7,120 | 5,490 | 3,680 | 9,716 | 2,642 | 3,43 | 1,189 |
m | 4,690 | 3,010 | 2,170 | 5,983 | 2,760 | 3,554 | 2,013 |
n | 5,510 | 1,340 | 1,270 | 5,808 | 4,566 | 5,382 | 3,427 |
o | 1,660 | 1,610 | 1,570 | 2,799 | 1,783 | 2,087 | 3,716 |
p | 5,900 | 5,756 | 1,550 | 8,388 | 5,395 | 7,497 | 1,973 |
q | 9,840 | 9,270 | 1,510 | 13,604 | 9,017 | 12,668 | 1,745 |
r | 8,390 | 4,920 | 2,540 | 10,053 | 3,956 | 5,237 | 1,432 |
s | 4,940 | 4,380 | 1,030 | 6,678 | 6,494 | 9,059 | 2,807 |
t | 7,230 | 2,300 | 1,770 | 7,790 | 4,393 | 5,374 | 2,274 |
u | 9,460 | 7,310 | 1,040 | 11,999 | 11,579 | 16,182 | 2,415 |
v | 9,550 | 5,350 | 4,250 | 11,742 | 2,766 | 3,509 | 1,054 |
w | 4,940 | 4,520 | 4,500 | 8,067 | 1,793 | 2,103 | 1,292 |
x | 8,210 | 3,080 | 2,420 | 9,097 | 3,753 | 4,657 | 1,719 |
y | 9,41 | 6,44 | 5,11 | 12,495 | 2,446 | 3,103 | 0,914 |
OK! We hebben nu dus een hele bak vol blokjes, en alles ligt door elkaar.
De vraag is nu: hoe sorteren we die set?
Als we even wat afstand nemen hebben we dus een stel objecten met (in dit voorbeeld) zeven eigenschappen. Het voorbeeld zou dus eigenlijk net zo goed kunnen worden opgevat als 25 scherven met zeven eigenschappen… of algemener: een aantal scherven met een heel stel eigenschappen!
Hier komt de boer op de proppen! (Klik hier voor het verhaal over de boer!) Hij heeft nu begrepen dat het er om gaat een optimale positie in te nemen ten opzichte van wat je wilt ordenen. In een driedimensionale wereld is de positie van de boer eenvoudig voor te stellen. Met twee dimensies was het al knap lastig, maar met de blokjes wordt het langzamerhand toch net iets ingewikkelder. Zeven dimensies kunnen we ons niet meer voorstellen. Wat zou er bijvoorbeeld gebeuren als we ook nog eens de kleur van het blokje toevoegen, of het gewicht, enfin. Het besef dringt door dat we een list moeten verzinnen om die blokjes goed te ordenen.
👉 Over die list een volgende aflevering. (Klik hier!)…
Maar als het puur om het resultaat gaat, lichten we bij deze al vast een tipje van de sluier…
