ModusPoens

W poprzednim wpisie przedstawiłem dosyć oczywisty fakt dotyczący zasady indukcji na grafie o jednej składowej spójnej. W obecnym, przejdziemy do nieco innej tematyki, wszakże wpis poprzedni nie był całkiem oderwany od dzisiejszego tematu. Mam nadzieję posługiwać się nim w przyszłości, był wiec to rodzaj przygotowania artyleryjskiego przed bitwą. Amunicji użyliśmy niewiele, a kaliber nie był zbyt wielki. Zobaczymy co dalej.

Na początek kilka słów o motywacji. W poprzednich kilku wpisach drapałem po wierzchu temat reprezentacji dowodów matematycznych jako grafu i próbowałem zdefiniować dla takich struktur grupy homologii tak by cechy dowodu ( konkretnie sprzeczność) miały jakieś homologiczne odzwierciedlenie. Niestety analizując temat dokładniej, dochodzę do wniosku ( o czym napiszę w kolejnych wpisach) że homologia nie wypali. Jest tak dlatego, ze struktura „triangulacji dowodów” jak ją nazwałem – nie jest struktura simplicjalną. Znalazłem błąd w swoim rozumowaniu, są kontrprzykłady, i trzeba stwierdzić, że tego typu podejście wygląda na skazane na daleko idące kłopoty ( co nie znaczy że homologia i logika nie dadzą się pożenić. Jestem przekonany że istnieje tu głęboki związek, np. przekonuje mnie do tego koincydencja faktu że istnieje tylko jeden rodzaj nieorientowalności rozmaitości i jeden rodzaj sprzeczności logicznej. )

Czas więc na kolejne podejście, bo sam pomysł „triangulacji dowodu” wydaje się nadal żywotny, kopie i kto wie, może coś sie z tego urodzi.

Zamierzamy pracować z dowodem matematycznym. Poniżej przedstawię ścisłą definicję tego co będę rozumiał pod tym pojęciem. Będzie ona oczywiście całkowicie klasyczna, zostanie jednak wypowiedziana w pewnej specyficznej terminologii. Aby ją wprowadzić musimy określić pewien obraz czym jest zbiór wyrażeń których ozywamy podczas dowodzenia twierdzenia matematycznego. Po pierwsze dowody powstają w ramach sformalizowanego rozumowania. Każdy dowód powstaje w ramach określonej teorii ta zaś posiada zwykle aksjomaty, operuje pewnego rodzaju obiektami pierwotnymi ( „rzeczy” o których mówi teoria, a których cechy definiują aksjomaty) oraz intensywnie czerpie z logiki określonego rodzaju ( np. logiki pierwszego rzędu FOL). Aksjomaty są relacjami które nakładamy na obiekty będące przedmiotem naszego rozumowania dowodowego, i zwykle w dowodzie nie używamy ich wszystkich, a tylko pewien podzbiór. Sytuacja ta ma prozaiczny powód – większość użytecznych teorii matematycznych posiada nieskończenie wiele aksjomatów. Jako przykład może posłużyć aksjomat indukcji, a używając prawidłowej terminologii: schemat aksjomatów indukcji. Jest to wyrażenie ( lub zdanie, wszakże w zapisie stosowanym zwykle, jest to zdanie wypowiedziane w logice wyższego rzędu niż FOL) które stwierdza, że „dla każdego zdania {T(n)} dotyczącego liczby naturalnej {n}, jeśli prawdziwe jest zdanie {T(0)} oraz {T(n) \Rightarrow T(n+1)} to prawdziwe jest {T(n)}„. Proszę zwrócić uwagę, ze schemat ów – rozwija sie na nieskończenie wiele aksjomatów, po jednym dla każdego zdania T o ile posiada ono cechy wymienione w owym schemacie aksjomatu. Oznacza to, że teoria korzystająca z owego schematu aksjomatów, w istocie posiada przeliczalną ilość aksjomatów. Rzecz jest znana i omówiona w każdym podręczniku podstaw matematyki.

W jaki sposób z schematu aksjomatów dostajemy konkretny aksjomat? Jakie jeszcze mogą lub są schematy aksjomatów?

Sprawa zwykle nie jest szczególnie drążona, wszakże stosowanie schematów aksjomatów jest powszechne. Dlaczego? W języku FOL nie jesteśmy w stanie wypowiedzieć treści kwantyfikowanej po zdaniach. Teoria matematyczna posługująca się językiem logiki pierwszego rzędu zawiera wyłącznie kwantyfikacje po obiektach, to jest po „rzeczach”. Np. w ramach teorii mnogości wypowiadamy zdania o zbiorach i elementach, ale nie o „twierdzeniach na temat zbiorów”. Tymczasem użycie tak prostej reguły jak

\displaystyle \phi \Rightarrow (\psi \Rightarrow \phi )

wymaga byśmy za {\phi} i {\psi} mogli podstawić dowolne zdania. Zwykle zapisuje się ów schemat aksjomatów systemu Hilberta, za pomocą zmiennych {\phi} i {\psi}, rozumiejąc przez to, że mamy do czynienia z nieskończenie wieloma aksjomatami, a {\phi} i {\psi} reprezentują każde możliwe zdanie. Stąd zapis takiego schematu zawiera zwykle kwantyfikator ogólny „dla każdego zdania {\phi} teorii T” {\phi \Rightarrow(\psi \Rightarrow \phi )} i można by wyobrażać sobie że mamy tu w istocie nieskończoną listę aksjomatów, po jednym dla każdego możliwego podstawienia zmiennych. W realnym rozumowaniu istnieje potrzeba użycia stosownej reguły dedukcji, pozwalającej zrealizować owo podstawienie, zasygnalizować je czytelnikowi dowodu. Zwykle ma ono postać zapisu „{\phi = q}” gdzie {q} jest juz zdaniem teorii, dotyczącym „rzeczy” i zapisanym w języku FOL.Jednak wyrażenie „{\phi=q}” nie jest prawidłowym wyrażeniem języka FOL. jest sztuczką syntaktyczną, zapisem mnemotechnicznym, odwołaniem sie do „indeksu w bazie danych aksjomatów” umyślnie oznaczonej „{\phi \Rightarrow(\psi \Rightarrow \phi )}” po to by z owej listy, wyfiltrować stosowny aksjomat dotyczący zdania „{q}„. Regułą taka, opisująca „podstawienie, oznaczmy ją chwilowo {P}, mogłaby mieć postać

\displaystyle P("\phi=q", "\phi\Rightarrow\phi") = " q \Rightarrow(\psi \Rightarrow q )"

Odczytalibyśmy ją jako „w schemacie „{\phi \Rightarrow(\psi \Rightarrow \phi )}” podstaw za {\phi} zdanie „{q}„. Zauważmy że sam symbol równości „{=}” użyty w nawiasach, nie oznacza że owo {\phi} staje się równe „{q}” na stałe a tylko mamy na myśli pewną konkretną realizację, selekcję, ze zbioru opisanego schematem aksjomatów. W terminologii informatycznej powiedzielibyśmy że zasięg leksykalny owego znaku „=” ograniczony jest wyłącznie do zapisu powyżej. Co więcej. wynik takiej operacji podstawienia nie jest zdaniem, a zaledwie kolejnym schematem który może zawierać, i zawiera w naszym przykładzie inne zmienne! Dopiero sekwencja podstawień eliminująca ze schematu wszystkie występujące w nim zmienne, daje w wyniku określone jednoznacznie przez użyte podstawienia, zdanie używanego w ramach teorii języka. Oczywiście jest wiele symbolik opisujących powyższą operację podstawienia. Wydaje mi sie jednak że zaproponowana jest w miarę wygodna i przejrzysta. Co więcej – wyrażenie „{\phi = q}” – choć nie jest zdaniem teorii ( a nawet nie jest zdaniem), będzie wprost występowało na liście wyrażeń używanych w dowodzie, podobnie jak schematy aksjomatów. Ale o tym poniżej.

Kolejnym obiektem który jest używany w procesie dowodowym sa tautologie. Przywołuje sie je czasami wprost – stwierdzając, że pewne zdanie jest prawdziwe niezależnie od prawdziwości występujących w nim zdań, a czasami jako schemat aksjomatów, z zmienną, jak opisano powyżej ( bo też i tautologie są nieprzebranym zbiorem „potencjalnych aksjomatów” zaś ich użycie w taki czy inny sposób jest zwykle kwestią estetyki i optymalizacji środków dowodowych). Ponieważ u podstaw prawdziwości tautologii leży sama logika, a w jej ramach najprostsza metoda sprawdzania prawdziwości – tabela wartościowania prawdy i fałszu, stwierdza sie zwykle że tautologie logiczne są konsekwencją zbioru pustego. Czyli że ich prawdziwość nie wymaga czynienia żadnych specyficznych założeń. Można by rzec, że posiadamy pewną regułę dedukcyjną T, od słowa tautologia, która pozwala nam wprowadzić do dowodu dowolne wyrażenie będące tautologią, a to poprzez wskazanie, ze jest owo wyrażenie konsekwencją zbioru pustego. Zapis wyglądałby następująco:

\displaystyle T(\emptyset ,t) \Rightarrow t

gdzie {\emptyset} to zbiór pusty zaś {t} to tautologia.

Widzimy że w takim zapisie, ze zbioru tautologii wybraliśmy zdanie {t}. Zapis ten jest w pewnym sensie patologiczny, gdyż reguła dedukcyjna dotycząca tautologii {T}, zawiera po obu stronach wyrażenia to samo zdanie {t}. Dlatego zapis ten, choć formalnie prawdziwy i zgodny z resztą terminologii ( o czym poniżej) nie będzie używany dalej zaś osiągniemy to kosztem dodania do naszego zapisu wszystkich tautologii jako dodatkowego, wyróżnionego zbioru tautologii o tym samym statusie co schematy aksjomatów. Nie musi być to od razu zbiór wszystkich tautologii używanej logiki. Wystarczy by zbiór ten zawierał te tautologie które są użyte w dowodzie który będziemy analizować.

Rozważyliśmy zatem trzy zbiory – zbiór aksjomatów A, zbiór tautologii T, oraz zbiór „indeksów”, wyrażeń postaci „{\phi=q}” oraz symbol {\emptyset}, które będę dalej nazywał zbiorem filtrów. Tutaj drobny komentarz, sygnalizujący rzecz nad którą sie zastanawiam, jednak nie umiem jej rozstrzygnąć. Zgodnie z teorią mnogości, zbiór pusty jest częścią każdego zbioru, tym samym należy też do zbiorów {T} i {A}. Być może rozsądniej byłoby rozważyć specjalny symbol na określenie tego rodzaju elementu którego konsekwencją sa tautologie, ale który sam nie jest konsekwencją żadnego rozumowania. Warto dodatkowo pamiętać, że w sensie ogólnym konsekwencją sprzecznego zbioru zdań ( np. teorii o sprzecznych aksjomatach) jest dowolne zdanie, a więc zbiór pełny zdań, a nie zbiór pusty.

Zacznijmy od formalnego przedstawienia opisanego powyżej budulca.

Mamy dany:

 

  • zbiór schematów aksjomatów {A},
  • zbiór tautologii {T},
  • zbiór filtrów {F}, który zawiera wyrażenia postaci „zmienna = zdanie”, oraz zbiór pusty {\emptyset}
  • zbiór L poprawnych syntaktycznie wyrażeń teorii

 

Definicja Zbioru Selektorów: Zbiór selektorów {S} to zbiór zawierający aksjomaty, tautologie i filtry.

Zbiór {Z = A \cup T} nazwiemy zbiorem zdań pierwotnych teorii. Element należący do zbioru selektorów {S} nazwiemy selektorem.

Chcielibyśmy nad zbiorem selektorów i zdań logiki bazowej zbudować mechanizmy umożliwiające rozumowanie dedukcyjne. Należy w tym celu zdefiniować reguły dedukcji, które w niezawodny sposób prowadzą od aksjomatów do poprawnych syntaktycznie wniosków. Pojawia się tu jednak pewien problem. Reguła dedukcji {R}, to funkcja, o 2 argumentach, która odwzorowuje zbiór selektorów {S} i zbiór zdań pierwotnych {Z} teorii, w zbiór poprawnych wyrażeń pewnego rodzaju. Nie są to jednak zdania, a jak widzieliśmy wyżej, schematy zdań, lub listy zdań, w zależności od przyjętego podejścia. Mamy zatem następującą definicję:

Reguły dedukcji: Regułą dedukcji jest to funkcja 2 argumentowa taka że, jeśli {x \in L}, {y \in S} to istnieje takie ( jednoznacznie wyznaczone) {z \in L} że

\displaystyle R(x,y) = z

Wyrażenie {x} nazywamy przesłanką, wyrażenie {y} nazwiemy selektorem, wyrażenie {z} to wniosek.

Ponieważ „nowe” zdania w teorii powstają wyłącznie w wyniku realizacji pewnej reguły dedukcji, a w powyższym wyrażeniu symbol „{=}” oznacza zwykłą równość, możemy każde wystąpienie zdania z zastąpić równoważnym wyrażeniem {R(x,y)}. Tym samym pojecie „zbiór zdań logiki bazowej” staje się czysto mnemotechnicznym wybiegiem, zaś każde zdanie teorii to po prostu odpowiednio zagnieżdżony ciąg reguł dedukcyjnych operujących na selektorach ( w pierwszym argumencie) oraz aksjomatach i tautologiach ( w drugim). Tym samym możemy stwierdzić, że zbiór zdań {L} jest zbyt duży dla naszych rozważań, zaś w tym co nastąpi będziemy rozważali wyłącznie wyniki iteracji reguł dedukcji na zbiorze {A \cup T}.

Zamiarem moim jest zbudowanie graficznej reprezentacji takich struktur, co ma też i taką zaletę, że choć wypowiadam wszystkie zdania poniżej w języku aksjomatów, dowodów itp. te same narzędzia powinny nadać sie do analiz systemów matematycznych gdzie zachodzi iteracja funkcji 2 argumentowych.

Podkreślmy w tym miejscu, że istotne cechy reguł dedukcyjnych:

 

  • reguły dedukcyjne są operacjami czysto syntaktycznymi
  • reguła dedukcyjna jest funkcją.
  • Zachodzą relacje jednoznaczności:
  • ( {R(a,b) =c} i {R(a,d) = c ) \Rightarrow b=d}
  • ( {R(a,b) =c} i {R(d,b) = c ) \Rightarrow a=d}
  • ( {R(a,b) =c} i {R(a,b) = d ) \Rightarrow c =d}
  • wynik działania reguły dedukcyjnej jest prawidłowym zdaniem języka L. Wolę jednak określić tą cechę w innych sposób. Zachodzi cecha przeniesienia typu zmiennej. Reguła dedukcyjna „przy użyciu selektora” przenosi typ z przesłanki na wniosek. Własność ta jest spełniona dla wszelkich reguł postaci modus ponens ( modus tollens itp.), zachodzi też dla wielu reguł rachunku sekwentów.

 

Uwaga – ostatnia cecha to pewnego rodzaju nadużycie. Niestety ściśle rzecz biorąc nie jest spełniona dla reguł polegających na podstawianiu czy też „filtrowaniu” jak wolałbym ten proces nazwać. W takim bowiem przypadku jako pierwszy argument występuje schemat aksjomatów, czyli lista zdań, zaś na etapie wyeliminowania wszystkich zmiennych, ostatni selektor wybiera z niej jedno zdanie, które zostaje zwrócone jako wniosek. Nie jest wykluczone, że jest to ślad czegoś ważniejszego, np. że reguły dedukcyjne powinny być odwzorowaniami zwracającymi nie tyle zdania, co całe listy zdań, zaś teoria powinna posiadać kanoniczne odwzorowanie pomiędzy jednoelementową listą zawierającą zdanie bez zmiennych a zbiorem zdań ( czyli pomiędzy jednoelementową listą i jej elementem) . Definicja taka dodałaby do teorii miłej symetrii, i miałaby sens, bowiem w wypadku podstawiania za jedną zmienną w schemacie w którym występuje ich kilka, wynik podstawienia nadal jest schematem a nie zdaniem.

W ogólności w teorii może występować więcej niż jedna reguła dedukcji, co będziemy sygnalizować przez ich ponumerowanie. Tym samym będziemy mówili o k-tej regule dedukcji {R_k}. Typowym przykładem może być tu system Hilberta gdzie mamy dwie reguły dedukcji: modus ponens i regułę podstawiania za zmienną. Istnieją systemy rachunków zdań gdzie reguł jest więcej ( lub mniej). W dalszych rozważaniach modus ponens ( zapisywana jako „mp”) i reguła podstawiania będą traktowane przeze mnie jako modelowy przykład takich reguł.

Zdefiniujmy co mamy na myśli operując pojeciem dowodu:

Definicja Dowodu: Dowód P twierdzenia t, to ciąg zdań {a_1,a_2 \cdots a_N =t}, o tej własności że dla każdego zdania {a_i} zachodzi jeden z elementów alternatywy:

  • {a_i \in A}, {a_i} jest schematem aksjomatu
  • {a_i \in T}, {a_i} jest tautologią,
  • {a_i \in F}, {a_i} jest elementem zbioru filtrów
  • ogólniej moglibyśmy napisać że {a_i \in S} – jest selektorem lub
  • istnieje liczba {p} oraz {j,k<i} takie że {a_i = R_p(a_j,a_k)} gdzie {R_p} to {p}-ta reguła dedukcji.
  • {a_N = t} nie jest filtrem.

wyrażenie t jest zdaniem ( bo nie jest filtrem) i nazywamy je tezą dowodu.

W ramach takiej definicji w dowodzie zostają zapisane jawnie wszystkie wyrażenia użyte w krokach dowodowych ( a nie tylko te które są zdaniami). Przez długość N dowodu P, rozumiemy ilość selektorów, czyli po prostu wyrażeń, które sie na niego składają.

Z powyższej definicji wynika, że dla każdego dowodu P, mamy ciąg wyrażeń będący jego reprezentacją. Każdemu wyrażeniu {a_i} w dowodzie P przyporządkujmy liczbę naturalną { \#(P,a_i)} – numer miejsca na którym wyrażenie to występuje w dowodzie P. Każdy dowód to skończony ciąg wyrażeń, więc { \#(P,a_i)} jest dobrze zdefiniowane i przybiera wartości od 1 ( dla pierwszego wyrażenia dowodu) aż po { \#(P,t) =N} gdzie {t} to teza dowodu zaś {N} to jego długość.

Dla wygody, kiedy dowód jest ustalony, opuścimy symbol P w powyższym zapisie, czyli będziemy używać wyrażeń postaci { \#(a_i) = n}. Jeśli zdanie q nie występuje w dowodzie, napiszemy \#(q) = 0 . Czasami pewnie opuścimy nawiasy pisząc sam symbol \#a_i =n

W dalszym ciągu będę używał słowa „zdania” w znaczeniu – schematy aksjomatów, tautologie lub zdania właściwe logiki bazowej teorii. Tym samym nie będziemy pedantycznie analizować zagadnień sygnalizowanych w pt. 4 cech reguł dedukcji. Proszę pamiętać jednak że zdanie może oznaczać zarówno poprawne twierdzenie teorii jak i cały schemat zdań ( a więc wyrażenie zawierające zmienne).

Dowód składa się z wyrażeń, ale nowe zdania pojawiają sie w dowodzie wyłącznie jako wynik działania reguł dedukcyjnych. Jeśli w wyniku działania {R_k(q_i,q_j) = q_s} to wykonaniu reguły dedukcyjnej {R_k} przypiszemy taki sam numer jak zdaniu {q_s}. Mamy zatem {\#(P, R_k(q_i,q_j)=q_s) = \#(P,q_s)} i definicja numeru miejsca w dowodzie {\#} zostaje rozszerzona na realizacje ( wystąpienia) reguł dedukcyjnych. O ile w wypadku wyrażeń numeracja jest ciągła, od 1 do N o tyle numeracja wystąpień reguł dedukcyjnych może zawierać luki. Prawdziwe jest jednak poniższe, oczywiste stwierdzenie:

Stwierdzenie: dla danego dowodu P, numeracja użycia reguł dedukcyjnych jest cięgiem ściśle monotonicznym.

Jest to wniosek z faktu, że numeracja zdań w dowodzie jest ściśle monotoniczna, zaś reguły dedukcyjne otrzymują te same numery co zdania, z pominięciem wyrażeń ze zbioru filtrów oraz bezpośredniego użycia aksjomatów i tautologii.

Wydaje sie że wyposażeni w takie narzędzia możemy wypisać podstawowe pojecie jakim będziemy sie zajmować w dalszym ciągu wpisów:

Definicja Triangulacji dowodu:

Triangulacja dowodu P to odwzorowanie {\mathcal{F}} dowodu P w graf skierowany G. Każde wystąpienie reguły dedukcyjnej {R(p,q)=s} jest odwzorowane na trójkąt skierowany {(pqs) = (pq) \cup (qs) \cup (ps)}

W odwzorowaniu tym każdemu zdaniu dowodu {a_i} przypisany jest wierzchołek grafu G. Różnym zdaniom przypisujemy rożne wierzchołki, tym samym zdaniom przypisujemy te same wierzchołki.

Będziemy zajmowali sie własnościami grafów które sa obrazami dowodów w odwzorowaniu {\mathcal{F}}. W następnym wpisie podam przykłady triangulacji, oraz zastanowimy się na jakie sposoby łączą się trójkąty w owej triangulacji.