Znane każdemu rodzicowi sa ciągi pytań “A dlaczego?”. Dlaczego Niebo Jest Niebieskie? Bo rozpraszania przebiega w taki sposób że czerwone promieniowanie rozprasza się mało, a niebieskie dużo. A dlaczego czerwone mało a niebieskie dużo? Bo taka jest charakterystyka związana z prawem Rayleigha. A dlaczego taka charakterystyka? Bo rozpraszanie zależy od odwrotności długości fali w 4-tej potędze. A dlaczego od 4-je potęgi? Bo takie jest rozwiązanie stacjonarne równania rozpraszania dla dużych długości fali. A dlaczego … I tak dalej i tak dalej.

    Wiadomo ze można taką zabawę ciągnąć bez końca. W wypadku wiedzy fizycznej, realnej wiedzy o realnym świecie, ciąg takich pytań nie ma końca. Jak jest w wypadku matematyki?

    Kiedyś pisałem, niezbyt jasno, o przypadkowej matematyce . Ostatnio zaś w necie natrafiłem na ciekawe pytanie jakoś tam związane z tym tematem. Oto Gil Kalai, matematyk z Izraela pracujący także w Stanach Zjednoczonych, i prowadzący bardzo fajnego bloga, zadał pytanie “Dlaczego jest możliwe uprawianie matematyki?”, po czym dodatkowo zwrócił uwagę na komentarz Timothy Gowersa, laureata medalu Fieldsa, na to pytanie. Wydaje sie że obaj panowie starają sie nadać temu pytaniu nieco bardziej techniczny, niż czysto filozoficzny, czy metamatematyczny charakter.

     Odpowiedź Gowersa jest o tyle ciekawa, że przywołuje pojęcia teorii złożoności obliczeniowej i probabilistyki. Gowers stwierdza, że jeśli wszystkim twierdzeniom matematycznym przypisać liczbę, zdefiniowaną jako “długość dowodu”, i potraktować ją jako zmienną losową, to “efektywna możliwość uprawiania matematyki” odpowiada ciekawej własności tej zmiennej. Otóż zmienna owa może przyjmować w zasadzie dowolnie wielkie wartości, wiemy że mogą istnieć twierdzenia posiadające proste, krótkie dowody, ale oczywiście istnieją także twierdzenia matematyczne, posiadające dowody bardzo długie, właściwie to dowolnie długie. Co prawda pojęcie nieskończenie długiego dowodu nie ma za bardzo sensu, jednak całkiem uzasadnione jest przyjąć że wartość zmiennej “długość dowodu” należy do przedziału od zera do nieskończoności. Mimo to – i tu dochodzimy do niebanalnej własności owej zmiennej – matematyka się rozwija przy użyciu relatywnie krótkich dowodów – zatem Gowers spekuluje że wartość spodziewana owej zmiennej “długości dowodu” jest niewielka. Długość dowodu może być bardzo mała lub bardzo duża, ale większość dowodów zdaje się być zdumiewająco krótka. Oczywiście sa to spekulacje, czego autor nie zapomina nadmienić.

     Wróćmy do kwestii “przypadkowej matematyki”. Rozumowanie Gowersa przypomniało mi to że o tym temacie kiedyś myślałem. I rzeczywiście także i tu, może warto do tematu podejść nieco bardziej rzeczowo. Będziemy starali sie rozumować przez analogię. Przypuśćmy że rozważamy inne pytanie. Mam liczbę, powiedzmy 3. Dodam do niej liczbę 2 – uzyskam 5. Pomnożę przez 8 – uzyskam 40. Mogę potęgować, dodawać, mnożyć. Wreszcie na koniec mogę wszystkie te operacje zapisać jako program komputerowy, albo sporych rozmiarów, wzór. Uzyskam przepis pozwalający wyliczać wynik wszystkich tych działań, nie tylko dla owej jednej liczby, ale dla innych liczb także, mówiąc krótko – stworzę pewną procedurę obliczeniową definiującą funkcję. Funkcja owa, złożona z elementarnych działań ( takich jak dodawania, mnożenie itp) może być bardzo wymyślna. mimo to w pewnych bardzo ogólnych warunkach będzie obliczalna. Wielkim osiągnięciem matematyki początków XX wieku było określenie owych warunków a zwłaszcza pokazanie, że funkcje obliczalne w ogóle wszystkich funkcji sa relatywnie niewielkim zbiorem. Budując analogię do rzeczy które chcę tu rozważać, możemy stwierdzić, że cokolwiek zrobimy z kilkoma elementarnymi działaniami, w skończonej ilości kroków, uzyskana w ten sposób operacja będzie funkcją obliczalną.

    Niemniej istnieją funkcje nieobliczalne, to znaczy takie których nie da się w ten sposób zapisać, ani nawet obliczyć. Czytelnikowi zainteresowanemu tym tematem polecam doskonałą monografię Murawskiego, w tym miejscu zwrócę zaś uwagę, że mamy tu do czynienia z fenomenem wielkiej wagi oraz posiadającym kilka ciekawych cech:

  1. nieobliczalność jest pewnego rodzaju fenomenem obiektywnym. Do tematu wrócimy poniżej.
  2. nieobliczalność nie polega na tym, że nie potrafimy obliczyć wartości funkcji f(x) nieobliczalnej dla pewnego jej argumentu x. To da sie zrobić dla każdego ustalonego argumentu, oczywiście pomijając kwestie techniczne typu rozmiarów pamięci czy wielkości uzyskanych liczb. Natomiast nie jest możliwe podanie “wzoru” czy tez “procedury” – dokładniej algorytmu – który pozwalałby na obliczenie wartości takiej funkcji dla wszystkich możliwych argumentów. Inaczej – nie istnieje pojedyncza procedura obliczeniowa – jedna dla wszystkich elementów dziedziny funkcji nieobliczalnej – która da jej wartość w tych punktach.
  3. w zasadzie brak odpowiedzi na pytanie czym charakteryzuje sie nieobliczalność w wypadku “realnie występujących zjawisk fizycznych”. Na pytanie “czy istnieją zjawiska fizyczne opisywane funkcjami nieobliczalnymi” nie znamy odpowiedzi. Z jednej strony obliczalność zdefiniowana jest dla liczb naturalnych ( ew. całkowitych) zaś fizyka używa liczb wymiernych. Jest to niezbyt istotna, ale jednak zawsze przeszkoda. Z drugiej strony wydaje się że nieobliczalność mogłaby manifestować się na dwa sposoby – albo jako bardzo szybki, nadeksponencjalny wzrost ( i przykładem takiego zjawiska jest np. Busy Beaver function), albo jako losowość.

 

    W tym miejscu przejdę do innego nieco zagadnienia. Jak wiadomo dla każdego systemu formalnego, mamy dwa możliwe sposoby opisu – syntaktyczny i semantyczny. Oba systemy wuymagają określenia symboli języka, relacji i funkcji wraz z ich arością, aksjomatów pozalogicznych i logicznych wraz z regułami inferencji ( jeśli tego nie określimy pozostaniemy w klasie systemów dedukcji). W systemie syntaktycznym możmy zapisywać twierdzenia i szukać ich dowodów, przy czym dowód jest ciągiem zdań zaczynającym sie od aksjomatów, a kończącym się twierdzeniem którego dowodzimy. W ciągu zdań o którym mowa albo zdania kolejne są aksjomatami, albo sa wynikiem użycia reguł inferencji do zdań poprzednich. Uzyskany w ten sposób zbiór twierdzeń, nazywamy konsekwencją syntaktyczną zbioru aksjomatów. Konsekwencja syntaktyczna to odpowiednik “rachunku”, “kalkulacji”.

     W obrazie semantycznym mamy pewien zbiór A zdań, zwykle aksjomatów, podobnie jak wyżej pozalogiczncyh i logicznych. Zdania te sa odnoszone do pewnego modelu – zbioru obiektów które spełniają zadania z wybranego zbioru A. Zwykle modeli – a więc “zbiorów przedmiotów spełniających zdania ze zbioru A” jest więcej niż jeden. Jeśli pewne inne zdania, zapisane w tym samym języku co zdania ze zbioru A są także prawdziwe w każdym z modeli zbioru A – wówczas mówimy że zdania te są konsekwencją semantyczną zdań ze zbioru A. Konsekwencja syntaktyczna to współprawdziwość, czy może lepiej “współspełnianie” gdyż omijając kwestię prawdziwości i ograniczając sie do spełnienia ( w sensie wartościowania logicznego), unikamy niebanalnych rozważań o tym czym jest prawda itp.

     Czy kwestia istnienia matematyki, możliwości jej uprawiania, nie przypomina tezy o obliczalności pewnych operacji? Tak jak zestawiając ze sobą działania elementarne uzyskiwaliśmy funkcje obliczalne, tak budując twierdzenia lub zbiory zdań współspełnialnych – budujemy teorie oparte o pewne elementarne operacje logiczne. Składamy rzeczy z jednakowych i wcześniej przygotowanych klocków. Możemy użyć ich jak nam sie podoba, możemy dokładać je z lewej, z góry i z prawej, ale klocki pozostają niezmienne, a możliwości łączenia pozostają ustalone z góry.

 

    W tym miejscu należy wspomnieć o kwestii niezależności i niedowiedlności. Oto jednym z ważnych faktów jest zjawisko niezależności logicznej. Okazuje sie że dla dostatecznie złożonych systemów, o ile pracujemy w logice pierwszego rzędu, istnieje wiele modeli. Fenomen ten oznacza, że nawet budując systemy fromalne, bradzo precyzyjnie i ścisle, nie określamy jednoznacznie obiektów które opisują wybrane przez nas aksjomaty.  Jest więcej “rodzajów liczb naturalnych” a dokładniej struktór spełniających aksjomatyke liczb naturalnych – niż tylko jeden znany nam przykład szkolny. W niektórych z modeli pewne zdania sa spełnione w innych nie. Przypomnijmy że konsekwencją semantyczna zbioru zdań są jedynie te zdania które są współprawdziwe z tym zbiorem, dla wszystkich modeli spełniających aksjomaty. Zdania te są zatem niezależne od zbioru aksjomatów – semantycznie nie są zdaniami współprawdziwymi. Ponieważ jednak istnieją modele w których możliwa jest współprawdziwość z aksjomatami ( choć w innych modelach nasze zdania sa nieprawdziwe a więc niespełnione) to stajemy przed kwestią wyboru. Wybór jest takiego rodzaju – albo możemy przyjąć że owe niezależne zdania należą do zbioru aksjomatów ( i tym samym poszerzyć ów zbiór, zaś zawęzić zbiór modeli), albo możemy osąd o zdaniach niezależnych zawiesić i badać teorie z większą ilością modeli, ewentualnie dodając że pewne “fakty” zależą od zawieszonego rozstrzygnięcia co do prawdziwości owych zdań. Zwykle w praktyce posiłkujemy sie kryterium efektywności – wybieramy ewentualności prowadzące do ciekawszej, efektywniejszej, bardziej estetycznej matematyki. Nie jest to jedak cała historia. Zdania prawdziwe we wszystkich modelach, będące sematyczną konsekwencją aksjomatów, mogą być niedowiedlne w ramach przyjętych metod syntaktycznych. Fenomen ten objawia się w fakcie że z punktu widzenia metod logiki 1-szego rzędu, dowody pewnych twierdzeń muszą przebiegać “inaczej” dla każdej liczby n która spełnia warunki takich twierdzeń. Każda liczba może być “przypadkiem szczególnym” zaś ogólne rozumowanie dowodzące twierdzenia we wszystkich takich przypadkach możliwe jest dopiero w logice wyższego rzędu lub w mocniejszej teorii ( np. w teorii mnogości)

     Pytając “dlaczego?” dostatecznie długo, w fizyce, nie uzyskujemy ostatecznej odpowiedzi. W matematyce jest inaczej. W końcu ostateczną odpowiedzią zawsze jest aksjomat. “Dlaczego to twierdzenie jest prawdziwe? Bo tak wynika logicznie z aksjomatów.” Zauważmy że w przypadku opisanym powyżej mamy do czynienia z niezależnością od zadanego zbioru aksjomatów. Tym samym fenomen niezależności logicznej jest fenomenem relatywnym. Obiektywnym faktem jest fakt istnienie zdań niezależnych – dla każdego skończonego zbioru aksjomatów ( a nawet dla zbiorów nieskończonych, przeliczalnych, pewnych określonych własnościach) istnieją zdania niezależne. Zdania których prawdziwość w modelach nie jest jednakowo określona. Sama niezależność konkretnego zdania nie wydaje sie jednak być obiektywnym faktem. Zmieniając układ aksjomatów ( w ramach zbiotu zdań pozostających swoimi konsekwencjami semantycznymi), uzyskamy inne zdania niezależne i inne “moce teorii”. Zdania wcześniej niezależne moga stać sie dowodliwe ( jeśli któryś z “nowych aksjomatów” był wcześnij zdaniem współprawdziwym lecz niedowiednlnym). Wreszcie rozszerzenie zbioru aksjomatów o zdania niezależne ( a więc niewspółprawdziwe) prowadzi do innych – mocniejszych teorii. Jest to zupełnie inna sytuacja niż w wypadku fenomenu nieobliczalności. Jak nadmieniłem w punkcie 1 powyżej – fenomen obliczalności funkcji ma znaczenie obiektywne. Być może jest tak, gdyż elementarne operacje jakie wykonujemy na funkcjach – tak zostały zdefiniowane funkcje obliczalne – są określone w sposób obiektywny i ustalony. Dysponujemy tu operacjami arytetycznymi, ograniczonym kwantyfikatorem i efektywnym minimum, oraz operacją składania funkcji ( rekurencja). Nie mamy tu wolności wyboru. Nie umiemy jako “bazy funkcji elementarnych” wybrać operacji nieobliczalnych co być może pozwoliłoby zapisywać złożone funkcje nieobliczalne jako “złożenie” prostszych klocków.

     W tym miejscu mogę wreszcie zadać pytanie o “przypadkową matematykę” w nieco bardziej techniczny sposób. Pytanie to mogłoby brzmieć mniej więcej tak: czy istnieją fakty matematyczne których prawdziwość nie zależy od przyjętego zbioru aksjomatów, pomimo że są spełnione w każdym z modeli? Na przykład – logika 2-giego rzędu pozwala na usunięcie problemów niezależności zdań dla arytmetyki Peano (PA). Fenomen ten polega na tym, iż w logice 2-giego rzędu istnieje tylko jeden model liczb naturalnych, nie ma modeli niestandardowych. Każde twierdzenie takiej teorii albo jest spełnione albo nie. Płacimy za to pewną cenę, teoria taka ma w zasadzie patologiczne własności ( np. niektóre dowody stają sie nieskończenie długie). Jednak przypuśćmy że w takiej teorii występuje pewna własność liczb, powiedzmy “twierdzenie X”, które stwierdza że liczba X o pewnej własności istnieje. Można sobie wyobrazić sytuację w której owa liczba istnieje także w każdym z modeli PA w logice 1-szego rzędu. I że brak jest dowodu tego faktu, bowiem dowód taki wymaga narzędzi dostępnych jedynie w logice 2-giego rzędu, powiedzmy indukcji pozaskończonej ( takie przykłady istnieją). Możemy wówczas stwierdzić, że choć istnienie liczby X nie ma wyjaśnienia na gruncie PA, to przecież nie jest przypadkiem. Jest to “prawdziwa” własność liczb naturalnych, wszakże niezależna od aksjomatów PA w teorii 1-szego rzędu.

     Pytam więc o istnienie takich cech obiektów teorii które są niezależne od aksjomatów – obiektywnie – a więc w dowolnym rzędzie logiki i w dowolnej aksjomatyzacji. Cech których istnienie jest całkowicie przypadkowe, i nie wynika z niczego co jawnie założyliśmy. Być może odwołując sie do kwestii obiektywności obliczalności funkcji, można by napisać że owa “przypadkowa cecha” nie tyle jest przypadkowa, co raczej wynika z pewnych określonych i niemożliwych do zmiany cech naszych rozumowań, tak jak nieobliczalność, nierelatywnych do wygodnych konwencji, lecz związanych z samą naturą języka i konsekwencji logicznej. Byłyby to zdania, twierdzenia czy własności, których istnienie byłoby konsekwencją np. skończoności zapisu elementów języka, związane z elementarnymi koncepcjami logicznymi jak kwantyfikacja czy negacja. Cechy czy własności takie byłyby obecne we wszystkich modelach jednak nie znajdywałyby syntaktycznego dowodu. Istnienie takich własności jest łatwe do przeoczenia, głównie dlatego że praktyka matematyczna, to przede wszystkim nieformalna praktyka syntaktyczna. Wydaje sie że praktykujący matematyk częściej buduje sobie określony model badanych pojęć a następnie szuka dowodu spostrzeżonych cech, niż szuka zdań wspólprawdziwych w jednym z wielu modeli