bq. Să se determine dacă $n$ este o putere a lui 2 (întrebare interviu Microsoft).
h3. Rezolvare
==code(cpp)|
int isTwoPower(long n) {
return ( n & (n - 1) ) == 0 ;
int isTwoPower(long n){
return (n & (n-1) == 0);
}
==
h2(#preprocesare). _O altă abordare: preprocesarea_
h2(#preprocesare). O altă abordare: preprocesarea
Operaţiile prezentate mai sus sunt implementate în limbajele de asamblare, dar câteodată se folosesc algoritmi naivi şi atunci o implementare inteligentă ajunge să fie mai rapidă decât instrucţiunea din limbajul de asamblare. Pentru unele supercalculatoare aceste instrucţiuni sunt instrucţiuni ale procesorului.
Se pot găsi alţi algoritmi mai rapizi decât cei de mai sus, dar de obicei găsirea unui algoritm mai inteligent este mai grea decât folosirea unei abordări banale care aduce un câştig foarte mare: _preprocesarea_.
Se pot găsi alţi algoritmi mai rapizi decât cei de mai sus, dar de obicei găsirea unui algoritm mai inteligent este mai grea decât folosirea unei abordări banale care aduce un câştig foarte mare: preprocesarea.
În continuare vom rezolva problemele prezentate anterior folosindu-ne de preprocesarea datelor.
h3(#aplicatia-p1). Rezolvarea aplicaţiei #1
h3(#aplicatia-p1). Aplicaţia #1
Determinăm, pentru numerele de la $0$ la $2^16^ - 1$, un tablou $num$, în care $num[i]$ este egal cu numărul de biţi de $1$ din reprezentarea binară a lui $i$. De aici obţinem soluţia...
bq. Determinăm, pentru numerele de la 0 la $2^16^ - 1$, un tablou $num$, în care $num[i]$ este egal cu numărul de biţi de 1 din reprezentarea binară a lui $i$.
De aici obţinem soluţia:
==code(cpp)|
int count(long n) {
return num[n & 0xFFFF] + num[n >> 16];
int count(long n){
return num[n & 0xFFFF] + num[n >> 16];
}
==
h3(#aplicatia-p2). Rezolvarea aplicaţiei #2
h3(#aplicatia-p2). Aplicaţia #2
Determinăm, pentru numerele de la $0$ la $2^16^ - 1$, un tablou $par$, în care $par[i]$ este egal cu paritatea numărului de biţi de $1$ din reprezentarea binară a lui $i$. De aici obţinem soluţia...
bq. Determinăm, pentru numerele de la 0 la $2^16^ - 1$, un tablou $par$, în care $par[i]$ este egal cu paritatea numărului de biţi de 1 din reprezentarea binară a lui $i$.
De aici obţinem soluţia:
==code(cpp)|
int parity(long n) {
return par[n & 0xFFFF] ^ par[n >> 16];
int parity(long n){
return par[n & 0xFFFF] ^ par[n >> 16];
}
==
h3(#aplicatia-p3). Rezolvarea aplicaţiei #3
h3(#aplicatia-p3). Aplicaţia #3
Determinăm, pentru numerele de la $0$ la $2^16^ - 1$, un tablou $l$, în care $l[i]$ este egal cu cel mai nesemnificativ bit de $1$ din reprezentarea binară a lui $i$. De aici obţinem soluţia...
bq. Determinăm, pentru numerele de la 0 la $2^16^ - 1$, un tablou $l$, în care $l[i]$ este egal cu cel mai nesemnificativ bit de 1 din reprezentarea binară a lui $i$.
De aici obţinem soluţia:
==code(cpp)|
int low(long n) {
if (l[n & 0xFFFF]) return l[n & 0xFFFF];
else return l[n >> 16] << 16;
int low(long n){
if (l[n & 0xFFFF]) return l[n & 0xFFFF];
else return l[n >> 16] << 16;
}
==
h3(#aplicatia-p4). Rezolvarea aplicaţiei #4
h3(#aplicatia-p4). Aplicaţia #4
Determinăm, pentru numerele de la $0$ la $2^16^ - 1$, un tablou $h$, în care $h[i]$ este egal cu cel mai semnificativ bit de $1$ din reprezentarea binară a lui $i$. De aici obţinem soluţia...
bq. Determinăm, pentru numerele de la 0 la $2^16^ - 1$, un tablou $h$, în care $h[i]$ este egal cu cel mai semnificativ bit de 1 din reprezentarea binară a lui i.
De aici obţinem soluţia:
==code(cpp)|
int high(long n) {
if (h[n >> 16]) return h[n >> 16] << 16;
else return h[n & 0xFFFF];
int high(long n){
if (h[n >> 16]) return h[n >> 16] << 16;
else return h[n & 0xFFFF];
}
==
h3(#aplicatia-p5). Rezolvarea aplicaţiei #5
h3(#aplicatia-p5). Aplicaţia #5
Determinăm, pentru numerele de la $0$ la $2^16^ - 1$, un tablou $iH$, în care $iH[i]$ este egal cu indexul celui mai semnificativ bit de $1$ din reprezentarea binară a lui $i$ şi este egal cu $-1$ pentru $0$. De aici obţinem soluţia...
bq. Determinăm, pentru numerele de la 0 la $2^16^ - 1$, un tablou $iH$, în care $iH[i]$ este egal cu indexul celui mai semnificativ bit de 1 din reprezentarea binară a lui $i$ şi este egal cu -1 pentru 0.
De aici obţinem soluţia:
==code(cpp)|
int indexHigh(long n) {
if (iH[n >> 16] != -1) return iH[n >> 16] + 16;
else return iH[n & 0xFFFF];
if (iH[n >> 16] != -1) return iH[n >> 16] + 16;
else return iH[n & 0xFFFF];
}
==
h2(#algoritmi). _Algoritmi mai serioşi_
h2(#algoritmi). Algoritmi mai serioşi
Deşi ceea ce am prezentat mai sus sunt mai degrabă trucuri de implementare decât algoritmi serioşi şi în general nu se acordă aşa mare importanţă detaliilor de genul acesta, câteodată asemenea trucuri se pot dovedi importante mai ales în timpul concursurilor.
Un exemplu ar fi problema rundei 12 de la concursul de programare Bursele Agora. Acolo se cerea găsirea numărului de dreptunghiuri conţinute de o matrice binară $M$ care au în colţuri $1$. Un algoritm de complexitate $O(n^2^m)$ ar fi fost următorul: se consideră fiecare pereche formată din două linii şi se numără câte perechi $(M{~i,k~}, M{~j,k~})$ pentru care $M{~i,k~} = 1$ şi $M{~j,k~} = 1$ există. Fie acest număr $x$. Atunci numărul de dreptunghiuri care au colţurile pe aceste două linii va fi $x(x - 1) / 2$.
Un asemenea algoritm ar fi luat numai $64$ de puncte deoarece restricţiile date erau mari $(n ≤ 200, m ≤ 2500)$. Putem rescrie condiţia $M[i][k] == 1 && M[j][k] == 1$ ca şi $M[i][k] ^ M[j][k] == 1$, deci putem modifica rezolvarea anterioară în modul următor...
Un exemplu ar fi problema rundei 12 de la concursul de programare Bursele Agora. Acolo se cerea găsirea numărului de dreptunghiuri conţinute de o matrice binară $a$ care au în colţuri 1. Un algoritm de complexitate $O(n^2^ · m)$ ar fi fost următorul: se consideră fiecare pereche formată din două linii şi se numãrã câte perechi ( $a{~i,k~}$, $a{~j,k~}$ ) pentru care $a{~i,k~}$ = 1 şi $a{~j,k~}$ = 1 există. Fie acest număr $x$. Atunci numărul de dreptunghiuri care au colţurile pe aceste două linii va fi $x · (x - 1)$ / 2.
Un asemenea algoritm ar fi luat numai 64 de puncte deoarece restricţiile date erau mari ( $n ≤ 200$ , $m ≤ 2500$ ). Putem rescrie condiţia a[i][k] $= =$ 1 && a[j][k] $= =$ 1 ca şi ( a[i][k] ^ a[j][k] $= =$ 1 ), deci putem modifica rezolvarea anterioară în modul următor:
==code(cpp)|
pentru fiecare i
pentru fiecare j > i
L = M[i] ^ M[j];
b = a[i] ^ a[j];
sfârşit pentru
sfârşit pentru
numaraBitiUnu(L)
numaraBitiUnu(b)
==
Dacă în loc să păstrăm în $M[i][j]$ un element al matricei binare, păstrăm $16$ elemente, atunci în linia $L$ = $M[i] ^ M[j]$ se efectuează cel mult $2500/16$ calcule în loc de $2500$ de calcule. Acum, ce a rămas de optimizat este metoda _numaraBitiUnu_. Dacă folosim preprocesarea, atunci această metodă va fi compusă şi ea din $2500/16$ calcule. Se observă că în acest fel am mărit viteza de execuţie a algoritmului cu un factor de $16$.
Alt exemplu ar fi problema rundei 17. În acea problemă se cere determinarea numărului de sume distincte care se pot obţine folosind nişte obiecte cu valori date folosind fiecare obiect pentru o sumă cel mult o dată. Din nou o rezolvare directă, folosind marcarea pe un şir de valori logice n-ar fi obţinut punctaj maxim. Pentru obţinerea punctajului maxim următoarea idee ar fi putut fi folosită cu succes: şirul de valori logice se condensează într-un şir de întregi reprezentaţi pe $16$ biţi, şi acum actualizarea se face asupra a $16$ valori deodată. Deci şi aici se câştiga un factor de viteză egal cu $8$ (datorită detaliilor de implementare).
Dacă în loc să păstrăm în $a[i][j]$ un element al matricei binare, păstram 16 elemente, atunci în linia $b$ = $a[i] ^ a[j]$ se efectuează cel mult $2500 / 16$ calcule în loc de $2500$ de calcule. Acum ce a rămas de optimizat este metoda numaraBitiUnu. Dacă folosim preprocesarea, atunci această metodă va fi compusă şi ea $2500/16$ calcule. Se observă că în acest fel am mărit viteza de execuţie a algoritmului cu un factor de $16$.
Un al treilea exemplu ar fi problema _Viteza_ de la a 9-a rundă a concursului organizat de _.campion_ anul acesta. Acolo se cerea determinarea celui mai mare divizor comun a două numere binare de cel mult $10 000$ de cifre. După cum se ştie, complexitatea algoritmului de determinare a celui mai mare divizor comun a două numere este logaritmică, acest fapt este adevărat atunci când operaţiile efectuate sunt constante, dar în rezolvarea noastră apar numere mari, deci o estimare a numărului de calcule ar fi $maxn * maxn * log maxn$ (împărţirea are în medie costul $maxn * maxn$ dacă nu implementăm metode mai laborioase). Acest număr este prea mare pentru timpul de rezolvare care ne este cerut. Pentru a evita împărţirea, care este operaţia cea mai costisitoare, putem folosi algoritmul de determinare a celui mai mare divizor comun binar care se foloseşte de următoarele proprietăţi...
Alt exemplu ar fi problema rundei 17. În acea problemă se cere determinarea numărului de sume distincte care se pot obţine folosind nişte obiecte cu valori date folosind fiecare obiect pentru o sumă cel mult o dată. Din nou o rezolvare directă, folosind marcarea pe un şir de valori logice n-ar fi obţinut punctaj maxim. Pentru obţinerea punctajului maxim următoarea idee ar fi putut fi folosită cu succes: şirul de valori logice se condensează într-un sir de întregi reprezentaţi pe $16$ biţi, şi acum actualizarea se face asupra a 16 valori deodată. Deci şi aici se câştiga un factor de viteză egal cu 8 (datorită detaliilor de implementare).
# $cmmdc(a, b) = 2 * cmmdc(a / 2, b / 2)$, dacă $a$ şi $b$ sunt numere pare;
# $cmmdc(a, b) = cmmdc(a, b / 2)$, dacă $a$ este impar;
# $cmmdc(a, b) = cmmdc(a - b, b)$, dacã $a$ este impar, $b$ este impar şi $a$ > $b$.
Un al treilea exemplu ar fi problema Viteza de la a 9-a rundă a concursului organizat de *.campion* anul acesta. Acolo se cerea determinarea celui mai mare divizor comun a două numere binare de cel mult 10000 de cifre. După cum se ştie, complexitatea algoritmului de determinare a celui mai mare divizor comun a două numere este logaritmică, acest fapt este adevărat atunci când operaţiile efectuate sunt constante, dar în rezolvarea noastră apar numere mari, deci o estimare a numărului de calcule ar fi $maxn$ · $maxn$ · $log maxn$ (împărţirea are în medie costul $maxn$ · $maxn$ dacă nu implementăm metode mai laborioase). Acest număr este prea mare pentru timpul de rezolvare care ne este cerut. Pentru a evita împărţirea, care este operaţia cea mai costisitoare, putem folosi algoritmul de determinare a celui mai mare divizor comun binar care se foloseşte de următoarele proprietăţi:
$cmmdc(a, b)$ = 2 * $cmmdc(a / 2, b / 2)$, dacă $a$ si $b$ sunt numere pare;
$cmmdc(a, b)$ = $cmmdc(a, b / 2)$, dacã $a$ este impar;
$cmmdc(a, b)$ = $cmmdc(a - b, b)$, dacã $a$ este impar, $b$ este impar şi $a$ > $b$.
Aplicând acest algoritm numărul de calcule s-a redus la $maxn * log maxn$, dar nici acest număr nu este suficient de mic, şi deci
pentru accelerarea algoritmului folosim ideea utilizată în cele două probleme de mai sus. Împachetăm numărul în întregi, în pachete de câte $30$ de biţi, şi atunci deplasarea la stânga (adică împărţirea la $2$) şi scăderea vor fi de $30$ de ori mai rapide.
Aplicând acest algoritm numărul de calcule s-a redus la $maxn$ · $log maxn$, dar nici acest număr nu este suficient de mic, şi deci
pentru accelerarea algoritmului folosim ideea utilizată în cele două probleme de mai sus. Împachetăm numărul în întregi, în pachete de câte 30 de biţi, şi atunci deplasarea la stânga (adică împărţirea la 2) şi scăderea vor fi de 30 de ori mai rapide.
Să încercăm acum rezolvarea unei probleme în care eficienţa este cea mai importantă, mai importantă decât lizibilitatea codului obţinut. Problema are următorul enunţ...
Să încercăm acum rezolvarea unei probleme în care eficienţa este cea mai importantă, mai importantă decât lizibilitatea codului obţinut. Problema are următorul enunţ:
bq(#ciur). Se consideră un număr $n$. Să se determine numerele prime mai mici sau egale cu $n$, unde $n ≤ 10 000 000$.
bq(#ciur). Se consideră un număr $n$. Să se determine numerele prime mai mici sau egale cu $n$, unde $n$ ≤ 10.000.000.
Practic această problemă ne va fi utilă în testarea rapidă a primalităţii numerelor mai mici sau egale cu $n$.
Putem încerca mai multe rezolvări, dar în practică cea mai rapidă se dovedeşte de obicei cea numită _ciurul lui Eratostene_. Implementarea banală a algoritmului ar fi următoarea:
Putem încerca mai multe rezolvări, dar în practică cea mai rapidă se dovedeste de obicei cea numită ciurul lui Eratostene. Implementarea banală a algoritmului ar fi urmãtoarea:
==code(cpp)|
define maxsize 10000000
char at[maxsize]; // vector de valori logice în care numerele prime vor fi marcate cu 0
int n;
char at[maxsize]; //vector de valori logice în care numerele prime vor fi marcate cu 0
int isPrime(int x) {
return (!at[x]) ;
int n;
int isPrime(int x){
return (!at[x]) ;
}
void sieve() {
int i, j;
memset(at,0,sizeof(at)) ;
for (i = 2; i <= maxsize; i++) if (!at[i])
for (j = i + i; j <= maxsize; j += i)
at[j] = 1; // marcăm toţi multipli lui i ca fiind numere prime
void sieve(){
int i, j;
memset(at,0,sizeof(at)) ;
for (i = 2; i <= maxsize; i++)
if (!at[i])
for (j = i + i; j <= maxsize; j += i)
at[j]=1; //marcam toti multipli lui i ca fiind numere prime
}
==
Observăm că jumătate din timpul folosit de noi la preprocesare este pierdut cu numerele pare. Marcându-le de la început vom putea ignora numerele pare în preprocesare...
Observăm că jumătate din timpul folosit de noi la preprocesare este pierdut cu numerele pare. Marcându-le de la început vom putea ignora numerele pare în preprocesare:
==code(cpp)|
#define maxsize 10000000
char at[maxsize];
int n;
int isPrime(int x) {
return (!at[x]) ;
int isPrime(int x){
return (!at[x]) ;
}
void sieve() {
int i, j;
memset(at,0,sizeof(at));
for (i = 4; i <= maxsize; i += 2)
at[i] = 1;
for (i = 3; i <= maxsize; i += 2) if (!at[i])
for (j = i + i + i; j <= maxsize; j += i + i)
at[j] = 1;
void sieve(){
int i, j;
memset(at,0,sizeof(at));
for (i = 4; i <= maxsize; i += 2)
at[i] = 1;
for (i = 3; i <= maxsize; i += 2)
if (!at[i])
for (j = i + i + i; j <= maxsize; j += i + i)
at[j] = 1;
}
==
La marcarea multiplilor numărului prim $i$ toate numerele până la $i * i$ au fost deja marcate deoarece $i * i$ este cel mai mic număr care nu este divizibil cu numere naturale mai mici sau egale cu $i - 1$. Deci, avem o a treia versiune a programului...
La marcarea multiplilor numărului prim $i$ toate numerele până la $i · i$ au fost deja marcate deoarece $i · i$ este cel mai mic număr care nu este divizibil cu numere naturale mai mici sau egale cu $i - 1$, deci, avem o a treia versiune a programului:
==code(cpp)|
void sieve() {
int i, j;
memset(at,0,sizeof(at));
for (i = 4; i <= maxsize; i += 2)
at[i] = 1;
for (i = 3; i <= maxsize; i += 2) if (!at[i])
for (j = i * i; j <= maxsize; j += i + i)
at[j] = 1;
void sieve(){
int i, j;
memset(at,0,sizeof(at));
for (i = 4; i <= maxsize; i += 2)
at[i] = 1;
for (i = 3; i <= maxsize; i += 2)
if (!at[i])
for (j = i * i; j <= maxsize; j += i + i)
at[j] = 1;
}
==
Ultima optimizare este optimizarea spaţiului necesar. Într-un tip de date _char_ putem împacheta opt valori logice şi punând un test suplimentar în metoda _isPrime_ putem elimina şi numerele pare, astfel vom avea nevoie de un spaţiu de _16_ ori mai mic.
Ultima optimizare este optimizarea spaţiului necesar. Într-un tip de date char putem împacheta opt valori logice şi punând un test suplimentar în metoda isPrime putem elimina şi numerele pare, astfel vom avea nevoie de un spaţiu de 16 ori mai mic.
==code(cpp)|
#define maxsize 10000000
char at[maxsize / 16];
char at[maxsize/16];
int n;
int isPrime(int x) {
if (!(x & 1))
if (x == 2) return 0 ;
else return 1 ;
else return (at[((x - 3) >> 1) >> 8] & (1 << (((x - 3) >> 1) & 7))) ;
if (!(x & 1))
if (x==2) return 0 ;
else return 1 ;
else return (at[((x - 3) >> 1) >> 8] &
(1 << (((x - 3) >> 1) & 7))) ;
}
void sieve() {
int i, j;
memset(at, 0, sizeof(at)) ;
for (i = 3; i <= maxsize; i += 2)
if (!at[((i - 3) >> 1) >> 8] & (1 << (((i - 3) >> 1) & 7)))
for (j = i * i ; j <= maxsize ; j += i + i)
at[((i - 3) >> 1) >> 8] |= (1 << (((i - 3) >> 1) & 7))) ;
int i, j;
memset(at, 0, sizeof(at)) ;
for (i = 3; i <= maxsize; i += 2)
if (!at[((i - 3) >> 1) >> 8] &
(1 << (((i - 3) >> 1) & 7)))
for (j=i * i ; j <= maxsize ; j += i + i)
at[((i - 3) >> 1) >> 8] |=
(1 << (((i - 3) >> 1) & 7))) ;
}
==
h2. Concluzie
Asemenea optimizări ca şi cele prezentate în cadrul acestui articol se pot dovedi foarte utile în unele cazuri, dar ele fac programul ilizibil, tocmai din acest motiv, asemenea trucuri trebuie aplicate numai în locurile critice ale codurilor sursă pentru a duce la o creştere semnificativă de viteză a aplicaţiilor şi trebuie documentate foarte bine, mai ales dacă se doreşte sau este necesar ca alt programator să poată lucra cu codul respectiv mai târziu.
h2(#bibliografie). Bibliografie
# James A. Storer, _An Introduction to Data Structures and Algorithms_, Springer Verlag, 2001;
# T. H. Cormen, C. E. Leiserson, R. R. Rivest, _Introducere în algoritmi_, Editura Computer Libris Agora, 2000;
# 'The Aggregate Magic Algorithms':http://www.aggregate.org/MAGIC/
# 'TopCoder':http://www.topcoder.com/tc
Asemenea optimizări ca şi cele prezentate în cadrul acestui articol se pot dovedi foarte utile în unele cazuri, dar ele fac
programul ilizibil, tocmai din acest motiv, asemenea trucuri trebuie aplicate numai în locurile critice ale codurilor sursă pentru a
duce la o creştere semnificativă de viteză a aplicaţiilor şi trebuie documentate foarte bine, mai ales dacă se doreşte sau este necesar ca alt programator să poată lucra cu codul respectiv mai târziu.
h3(#bibliografie). Bibliografie
# James A. Storer, An Introduction to Data Structures and Algorithms, Springer Verlag, 2001
# T. H. Cormen, C. E. Leiserson, R. R. Rivest, Introducere în algoritmi, Editura Computer Libris Agora, 2000
# http://www.aggregate.org/MAGIC/
# http://www.topcoder.com/tc