Atenţie! Aceasta este o versiune veche a paginii, scrisă la 2008-12-09 20:34:06.
Revizia anterioară   Revizia următoare  

Problema satisfiabilităţii formulelor logice de ordinul doi

(Categoria Algoritmi, Autor Cosmin Negruşeri)

Introducere

Problema satisfiabiltăiţii, notată prescurtat cu SAT, cere determinarea existenţei pentru o formulă booleană  \phi a unei artibuiri satisfiabile. O formulă booleană  \phi este compusă din variabile logice  (x_{1}, x_{2}, ...) , operatori logici (  \wedge şi,  \vee sau,  \sim non,  \rightarrow implicaţie şi  \leftrightarrow echivalenţă), şi paranteze. O atribuire de valori booleene pentru variabilele acestei expresii se numeşte atribuire satisfiabilă dacă evaluarea expresiei după atribuirea valorilor dă ca rezultat valoarea de adevăr adevărat. De acum încolo vom folosi pentru simplitate valorile  1 şi  0 în loc de adevărat şi fals.

Un exemplu de formulă ar fi  \phi = ((x_{1} \rightarrow x_{2}) \vee \sim((\sim x_{1} \leftrightarrow x_{3}) \vee x_{4})) \wedge \sim x_{2} . Aceasta are atribuirea satisfiabilă  \langle x_{1} = 0, x_{2} = 0, x_{3} = 1, x_{4} = 1 \rangle pentru că  \phi = ((0 \rightarrow 0) \vee \sim((\sim 0 \leftrightarrow 1) \vee 1)) \wedge \sim 0 = (1 \vee \sim (1 \vee 1)) \wedge 1 = (1 \vee 0) \wedge 1 = 1.

Forme normale ale formulelor logice

Orice formulă booleană poate fi transformată în două forme:

  • Forma normal conjunctivă în care expresia este exprimată ca o conjuncţie de propoziţii, iar fiecare propoziţie este formată din o disjuncţie de literali. Un literal este o variabilă care poate fi sau nu negată. Un exemplu de expresie în forma normal conjunctivă ar fi:  (x_{1} \vee \sim x_{1} \vee \sim x_{2}) \wedge (x_{3} \vee x_{2} \vee x_{4}) \wedge (\sim x_{1} \vee \sim x_{3} \vee \sim x_{4}) care are pe  (x_{1} \vee \sim x_{1} \vee \sim x_{2}) ca primă propoziţie cu literalii  x_{1} ,  \sim x_{1} ,  \sim x_{2} .
  • Forma normal disjunctivă este formată ca o disjuncţie de propoziţii, fiecare dintre aceste propoziţii fiind o conjuncţie de literali. Un exemplu de o asemenea formulă ar fi următoarea:  (x_{1} \wedge x_{2} \wedge x_{3}) \vee (x_{1} \wedge \sim x_{2} \wedge x_{3}) \vee (x_{1} \wedge \sim x_{2} \wedge \sim x_{3}) \vee (\sim x_{1} \wedge x_{2} \wedge \sim x_{2}) .

SAT, 3-SAT, 2-SAT

Problema SAT este NP-completă. Defapt, este prima problemă NP-completă găsită. Stephen Cook a demonstrat NP-completitudinea ei în 1971. Pe vremea aceea nu se ştia nici măcar că problemele NP-complete există. Această problemă rămâne NP-completă chiar dacă restricţionăm expresiile la unele care în forma normal conjunctivă au doar trei literali. Problema satisfiabilităţii pentru asemenea expresii se numeşte 3SAT, şi multe probleme pot fi demonstrate a fi NP-complete prin reducerea la această problemă. Din fericire, problema 2SAT, adică cea pentru care în fiecare propoziţie există doar 2 literali se poate rezolva eficient. Restul articolului va prezenta trei metode de rezolvare a problemei 2SAT şi câteva aplicaţii ale acesteia la concursuri de programare.

Soluţii pentru 2-SAT

Un exemplu de problemă 2SAT ar fi satisfiabilitatea formulei  (x_{1} \vee \sim x_{2}) \wedge (\sim x_{1} \vee \sim x_{3}) \wedge (x_{1} \vee x_{2}) \wedge (x_{4} \vee \sim x_{3}) \wedge (x_{4} \vee \sim x_{1}) . Această formulă este satisfăcută de valorile  \langle x_{1} = 1, x_{2} = 0, x_{3} = 0, x_{4} = 1 \rangle . Pentru a satisface întreaga expresie trebuie ca în fiecare propoziţie cel puţin unul din cei doi literali să aibă valoarea de adevăr 1.

Soluţie O(M * 2N)

O primă metodă de rezolvare ar fi să încercăm toate cele 24 posibilităţi de atribuire posibilă, dar această metodă are ordinul de complexitate O(M * 2N) şi este eficientă doar pentru instanţe mici ale problemei.

Soluţie O(N * M)

Următoarea soluţie pare trivială, dar găsirea acestui algoritm şi realizarea faptului că el rezolvă corect problema este mai grea decât impresia lăsată după citirea ei. Considerăm o propoziţie oarecare cu două variabile p şi q, apoi una dintre ele, de exemplu p. Dacă literalul în care apare p este negat atunci îi atribuim valoarea 1. Pentru ca propoziţia respectivă să aibă 1 valoarea de adevăr atunci valoarea lui q este fixată. Fixând şi valoarea lui q, probabil şi alte propoziţii ce conţin literalul q vor avea celălalt literal fixat. Propagăm astfel o serie de schimbări. După ce toate schimbările forţate au fost făcute propoziţiile rezultate vor fi de următoarele tipuri:  a \vee b ,  1 \vee 0 ,  1 \vee 1 ,  1 \vee b . Propoziţii de tip  0 \vee b nu pot apărea pentru că toate schimbările forţate au fost deja propagate. Dacă apare o propoziţie  0 \vee 0 atunci alegerea făcută pentru valoarea lui p este greşită. Vom încerca şi alegerea opusă. Dacă ambele duc la o propoziţie de tip  0 \vee 0 atunci expresia nu poate fi satisfăcută. Propoziţiile de forma  1 \vee 0 ,  1 \vee 1 ,  1 \vee b pot fi ignorate. În acest fel am eliminat cel puţin o variabilă şi o propoziţie din expresie. Dacă expresia iniţială era satisfiabilă, atunci şi expresia din care s-au eliminate câteva propoziţii a rămas satisfiabilă. Continuând pe această idee obţinem un algoritm de complexitate O(N * M), pentru că la fiecare atribuire de valoare pentru o variabilă parcurgem şirul de propoziţii o dată.

Să vedem cum funcţionează algoritmul pentru expresia:  (x_{1} \vee \sim x_{2}) \wedge (\sim x_{1} \vee \sim x_{3}) \wedge (x_{1} \vee x_{2}) \wedge (x_{4} \vee \sim x_{3}) \wedge (x_{4} \vee \sim x_{1}) . Considerăm propoziţia  (x_{1} \vee \sim x_{2}) şi  \langle x_{2} = 1 \rangle . Astfel, vom obţine mai departe  (x_{1} \vee 0) \wedge (\sim x_{1} \vee \sim x_{3}) \wedge (x_{1} \vee 1) \wedge (x_{4} \vee \sim x_{3}) \wedge (x_{4} \vee \sim x_{1}) . În propoziţia  (x_{1} \vee 0)  x_{1} trebuie să fie egal cu  1 . Acum, expresia devine:  (0 \vee \sim x_{3}) \wedge (x_{4} \vee \sim x_{3}) \wedge (x_{4} \vee 0) . Din propoziţia  (0 \vee \sim x_{3}) obţinem  \langle x_{3} = 0 \rangle , iar din  (x_{4} \vee 0) obţinem  \langle x_{4} = 1 \rangle . Deci, atribuirea satisfiabilă este  \langle x_{1} = 1, x_{2} = 0, x_{3} = 0, x_{4} = 1 \rangle .

Soluţie O(N2)

O altă soluţie elegantă se bazează pe o metodă randomizată:

atribuim valori booleene arbitrare variabilelor;
cât timp expresia nu este satisfăcută execută
    găsim o propoziţie cu valoarea de adevăr 0;
    schimbăm valoarea de adevăr a oricăreia dintre cele două variabile prezente în propoziţie;  // ceea ce va face ca acea propoziţie să aibă noua valoare de adevăr 1;
sfcâttimp

De ce ar merge acest algoritm? Să presupunem că există o soluţie a problemei, o notăm cu S, iar cu X notăm şirul valorilor curente ale variabilelor. Ne uităm la fiecare pas al algoritmului la numărul de variabile care au valori diferite în soluţie faţă de cele din X (acest număr de diferenţe între elementele de acelaşi index pentru două şiruri se mai numeşte şi distanţă Hamming între şiruri). Fie această valoare la pasul current K. Noi am vrea să avem K = 0. Cum va evolua K pe parcursul algoritmului? La un moment dat noi schimbăm valoarea unei variabile luate aleator dintr-o propoziţie nesatisfăcută. Pentru că în S propoziţia este satisfăcută, înseamnă că cel puţin una dintre cele două variabile ale propoziţiei are valori diferite în X faţă de S. Astfel, operaţia făcută de noi are probabilitate de cel puţin 0.5 să ne aducă mai aproape de soluţie. Vom nota cu  T(i) numărul probabil de paşi în care un şir X aflat la distanţa Hamming egală cu i faţă de S, va fi transformat în S. Evident:

 T(0) = 0 .

 T(i) \le (T(i + 1) + T(i - 1)) / 2 + 1

Se pune semnul de inegalitate pentru că ambele variabile pot avea valori diferite faţă de cele din soluţie, deci schimbarea valorii oricăreia ar putea să ne aducă mai aproape de soluţie.

Pentru că dacă toate variabilele diferă de soluţie, orice schimbare ne aduce mai aproape de soluţie:

 T(N) = T(N - 1) + 1

Ne interesează numai limitele superioare, deci folosim doar egalităţi în loc de inegalităţi:

 X(0) = 0, X(i) = (X(i + 1) + X(i - 1))/2 + 1, X(N) = X(N - 1) + 1

Dacă adunăm toate ecuaţiile obţinem:

[Unparseable or potentially dangerous LaTeX formula! Error 5 : 820x20]

De aici avem că  (X(1) + X(N) - X(N - 1)) / 2 = N , din  X(N) = X(N - 1) + 1 avem  X(1) = 2N - 1 . Mai departe avem că  X(2) = 4n - 4 ... X(i) = 2iN - i^2^ de unde, când  i = N avem că  X(N) = N^2^ .

Astfel, numărul mediu de paşi ai algoritmului este N2 iar dacă aplicăm algoritmul în mod aleator de mai multe ori avem o probabilitate foarte mare să ajungem la rezultat.