Lēmumu pieņemšanas mīkla, kur intuīcija saduras ar varbūtību
Divu aplokšņu paradokss ir klasisks domas eksperiments par lēmumu pieņemšanu nenoteiktībā. Jums priekšā ir divas aizlīmētas aploksnes ar naudu. Zināms tikai tas, ka vienā aploksnē ir divreiz vairāk naudas nekā otrā, taču nav zināms, kura ir kura. Jūs izvēlaties vienu aploksni, un pēc tam jums piedāvā iespēju to samainīt pret otru. Šķietami korekts aprēķins rāda, ka mainīt ir izdevīgi vienmēr, neatkarīgi no sākotnējās izvēles. Tieši šis secinājums arī rada paradoksu.
PARADOKSA PAMATUZSTĀDĪJUMS
Situāciju var aprakstīt šādi:
Ir divas aploksnes. Vienā ir mazāka naudas summa, to apzīmēsim ar A. Otrā ir lielāka summa – 2A.
Jūs nezināt, kurā aploksnē ir A un kurā – 2A, un no jūsu skatpunkta katrai aploksnei ir vienāda iespējamība saturēt mazāko vai lielāko summu.
Jūs izvēlaties vienu aploksni un apzīmējat tajā esošo summu ar X (aploksni vēl neatverat – X ir tikai simbols “tam, kas tur iekšā”).
Pirms atvēršanas jums piedāvā iespēju samainīt aploksni pret otru.
Jautājums ir: vai jums vajadzētu mainīt aploksni?
No pirmā acu uzmetiena šķiet, ka nav iemesla dot priekšroku ne vienai, ne otrai aploksnei – situācija ir simetriska, tāpēc palikšana pie sākotnējās izvēles un maiņa izskatās vienlīdzīgas. Tomēr paradokss rodas tāpēc, ka pastāv vilinošs argumentācijas veids, kas it kā pierāda: mainīt ir izdevīgi vienmēr.
KĀPĒC IZSKATĀS, KA VIENMĒR VAJAG MAINĪT
Parasti paradoksālais arguments tiek formulēts šādi:
Lai X ir summa jūsu izvēlētajā aploksnē.
Ja jūsu aploksnē ir mazākā summa A, tad otrā aploksnē ir 2A = 2X.
Ja jūsu aploksnē ir lielākā summa 2A, tad otrā aploksnē ir A = X/2.
No jūsu skatpunkta šķiet, ka katram no šiem gadījumiem (aploksnē ir A vai 2A) ir varbūtība 1/2.
Tad jūs mēģināt aprēķināt gaidāmo ieguvumu, ja maināt aploksni:
Ar varbūtību 1/2 maiņa dod 2X.
Ar varbūtību 1/2 maiņa dod X/2.
Gaidāmā vērtība, ja maināt aploksni:
(1/2) · 2X + (1/2) · (X/2)
= X + X/4
= 5X/4.
Šī summa ir lielāka par X – to, kas (pēc definīcijas) ir jūsu pašreizējā aploksnē. Tātad šķiet, ka:
Neatkarīgi no tā, kāda ir X vērtība,
Gaidāmais ieguvums, mainot aploksni, ir 5X/4,
Tāpēc vienmēr vajadzētu mainīt aploksni.
Te arī parādās paradokss: ja šī loģika ir pareiza, tad jūs vienmēr gribētu mainīt aploksni – pat tad, ja sākumā jau esat izvēlējies “labāko” aploksni. Un, ja pēc maiņas atkal piemērojat to pašu argumentu, tas atkal liek mainīt atpakaļ. Rezultātā jūs it kā gribētu mainīt bezgalīgi, kas acīmredzami nav jēdzīgs lēmums.
Tātad kaut kur šajā argumentā ir kļūda.
KUR PATIESĪBĀ SALŪZT LOĢIKA
Galvenā problēma slēpjas tajā, kā mēs lietojam simbolu X un kā piešķiram varbūtības.
Kad sakām “aploksnē ir X, bet otrā var būt X/2 vai 2X”, mēs nemanot mainām X nozīmi:
Gadījumā, kad jūsu aploksnē ir mazākā summa A, X = A un otrā aploksnē ir 2X = 2A.
Gadījumā, kad jūsu aploksnē ir lielākā summa 2A, X = 2A un otrā aploksnē ir X/2 = A.
Tātad X nav viena fiksēta, zināma vērtība – tas nozīmē “kāda nu tur gadījusies summa jūsu izvēlētajā aploksnē”. Varbūtības “1/2, ka otrā aploksnē ir X/2, un 1/2, ka ir 2X” nav korekti definētas vienam un tam pašam X. Aprēķins sajauc divas dažādas situācijas, it kā tās būtu viena.
Lai paradoksu analizētu korekti, ir jāapraksta, kā vispār tiek izvēlētas summas aploksnēs. Piemēram:
Vai A tiek izvēlēta no ierobežota intervāla (piemēram, vienmēr starp 1 un 1000)?
Vai A tiek izvēlēta pēc kādas varbūtību sadalījuma likumsakarības (piemēram, tikai 2 pakāpes ar noteiktām varbūtībām)?
Vai A teorētiski var būt patvaļīgi liela, bez augšējās robežas?
Atkarībā no šiem pieņēmumiem varbūtības, ka otrā aploksnē ir puse vai dubults no jūsu summas, vairs nav obligāti 1/2 un 1/2, ja ņem vērā konkrēto novēroto summu.
Ja izmanto konsekventu varbūtību modeli tam, kā tiek izvēlēta A, izrādās, ka:
vai nu maiņai un nemaiņai ir tieši vienāda gaidāmā vērtība, vai
“vienmēr mainīt” stratēģija nemaz nav optimāla visām iespējamām summām.
Citiem vārdiem sakot, vienkāršais “5X/4” aprēķins balstās uz nekorektu X lietojumu un nereālistiskiem pieņēmumiem par varbūtībām.
POPULĀRĀKIE PARADOKSA ATRISINĀJUMA VIRZIENI
Dažādi skaidrojumi izceļ atšķirīgas kļūdas šajā argumentā. Šeit ir daži no biežāk minētajiem.
Reālistiski summu ierobežojumi
Reālajā pasaulē naudas daudzums nav bezgalīgs. Vienmēr pastāv praktiska augšējā robeža tam, cik daudz varētu būt aploksnē. Ja šādu robežu iekļauj modelī, gaidāmā vērtība, mainot aploksni, vairs nav vienmēr lielāka par palikšanu pie sākotnējās izvēles. Pie ļoti lielām summām pat var būt racionālāk nemainīt, jo maz ticams, ka otrā aploksnē ir vēl vairāk.
Sākotnējā sadalījuma (priora) nozīme
Lai vispār varētu runāt par varbūtībām un gaidāmajām vērtībām, ir jānosaka, kā sākotnēji tiek izvēlētas summas aploksnēs. Šo pieņēmumu sauc par priora sadalījumu. Ja priors ir izvēlēts neveikli (piemēram, tā, ka tas “neuzvedas” saprātīgi pie ļoti lielām summām), paradokss parādās. Ja priors ir reālistisks, tad gaidāmā vērtība, mainot aploksni, nav viennozīmīgi labāka par palikšanu pie tās pašas aploksnes visiem X.
Sajaukta nosacītā varbūtība
Paradoksālais arguments izturas tā, it kā “varbūtība, ka otrā aploksnē ir lielāka summa” un “varbūtība, ka tur ir mazāka summa” vienmēr būtu 1/2. Taču, tiklīdz jūs redzat vai pieņemat konkrētu summu X, šīs varbūtības mainās. Atkarībā no modeļa var kļūt ticamāk, ka X ir lielākā summa, vai tieši otrādi – mazākā. Ignorējot šo faktu, nonāk pie kļūdainiem secinājumiem.
Stratēģijas, nevis viena soļa skatījums
Vēl viens skatpunkts ir analizēt nevis vienu maiņas soli, bet pilnu stratēģiju. Ja simetriskā situācijā vienmēr piemēro “vienmēr mainīt” argumentu, iegūst stratēģiju, kas mudina mainīt atkal un atkal, neko faktiski neuzlabojot. Tas parāda, ka šī loģika nevar būt pareiza – laba lēmumu pieņemšanas stratēģija nedrīkst novest pie bezgalīgas svārstīšanās.
KĀPĒC ŠIS PARADOKSS IR INTERESANTS
Divu aplokšņu paradokss nav tikai jauka mīkla. Tas izgaismo vairākas būtiskas idejas:
Mūsu intuīcija par varbūtībām un gaidāmo izdevīgumu var būt maldinoša, ja informācija ir nepilnīga.
Ir viegli uzrakstīt formulu, kas izskatās korekta, bet slepus balstās uz nekonsekventiem pieņēmumiem.
Reālistiska lēmumu pieņemšana prasa rūpīgi domāt par to, kā situācija ir uzbūvēta, nevis tikai mehāniski rēķināt.
Paradokss ir cieši saistīts ar varbūtību teoriju, lēmumu teoriju un pat filozofiju. To bieži izmanto, lai parādītu, kā “bezgalīgi” vai neierobežoti modeļi var radīt dīvainus rezultātus un cik svarīgi ir precīzi definēt, kā tieši tiek piešķirtas varbūtības.
SECINĀJUMS
Divu aplokšņu paradokss šķiet vienkāršs: divas aploksnes, vienā divreiz vairāk naudas nekā otrā, un brīva izvēle mainīt. Ātrs aprēķins it kā parāda, ka maiņa vienmēr palielina gaidāmo ieguvumu. Taču, iedziļinoties, kļūst skaidrs, ka šis aprēķins nepareizi lieto simbolu X un ignorē, kā summas aploksnēs vispār tiek izvēlētas.
Kad pieņēmumi tiek noformulēti konsekventi, paradokss izzūd. Maiņa nav automātiski labāka – daudzos saprātīgos modeļos gaidāmā vērtība, mainot aploksni vai paliekot pie tās pašas, ir vienāda. Šis paradokss atgādina, ka tikpat svarīgi kā matemātika ir arī pieņēmumi, uz kuriem tā balstās.