Siruri de sufixe

Acest articol a fost adăugat de

Lucian Boca •amadaeus
Intră aici dacă doreşti să scrii articole sau află cum te poţi implica în celelalte proiecte infoarena!

(Categoria Algoritmi, autori Adrian Vladu, Negruseri Cosmin)

Introducere

Un domeniu important in algoritmica folositÃ„ï¿½ ÃƒÂ®n practicÃ„ï¿½ este acela al algoritmilor pe Ã…ï¿½iruri de caractere. Astfel la concursurile de programare sunt prezente foarte multe probleme de prelucrare Ã…ï¿½i procesare a unor Ã…ï¿½iruri de caractere. Ãƒï¿½n cadrul concursurilor Ã…ï¿½i antrenamentelor mulÃ…Â£i dintre noi s-au lovit de probleme ce s-ar fi rezolvat uÃ…ï¿½or dacÃ„ï¿½ se reuÃ…ï¿½ea ÃƒÂ®n mod eficient determinarea existenÃ…Â£ei unui cuvÃƒÂ¢nt ca subsecvenÃ…Â£Ã„ï¿½ a unui alt cuvÃƒÂ¢nt. Vom prezenta o structura versatilÃ„ï¿½ ce permite acest lucru, ÃƒÂ®nlesnind de multe ori realizarea altor operaÃ…Â£ii utile pe un string dat.

Ce sunt Ã…ï¿½irurile de sufixe (suffix arrays)?

Pentru a avea o idee mai bunÃ„ï¿½ despre suffix arrays, vom face ÃƒÂ®nainte o scurtÃ„ï¿½ prezentare a structurii de date numitÃ„ï¿½ ÃƒÂ®n englezÃ„ï¿½ trie Ã…ï¿½i a arborilor de sufixe (suffix trees [1]) care sunt o formÃ„ï¿½ specialÃ„ï¿½ a structurii de date trie. Un trie este un arbore menit sÃ„ï¿½ stocheze Ã…ï¿½iruri. Fiecare nod al lui va avea ÃƒÂ®n general un numÃ„ï¿½r de fii egal cu mÃ„ï¿½rimea alfabetului Ã…ï¿½irurilor de caractere care trebuies stocate. Ãƒï¿½n cazul nostru, cu Ã…ï¿½iruri ce conÃ…Â£in litere mici ale alfabetului englez, fiecare nod va avea cel mult 26 de fii. Fiecare muchie care porneÃ…ï¿½te din tatÃ„ï¿½ spre fii Ã…ï¿½i va fi etichetatÃ„ï¿½ cu o literÃ„ï¿½ distinctÃ„ï¿½ a alfabetului. Etichetele legÃ„ï¿½turilor de pe un drum de la rÃ„ï¿½dÃ„ï¿½cina pÃƒÂ¢nÃ„ï¿½ la o frunzÃ„ï¿½ vor alcÃ„ï¿½tui un cuvÃƒÂ¢nt stocat in arbore. DupÃ„ï¿½ cum se observÃ„ï¿½, cÃ„ï¿½utarea existenÃ…Â£ei unui cuvÃƒÂ¢nt ÃƒÂ®n aceastÃ„ï¿½ structurÃ„ï¿½ de date este foarte eficientÃ„ï¿½ Ã…ï¿½i se realizeazÃ„ï¿½ ÃƒÂ®n complexitate O(M), unde M e lungimea cuvÃƒÂ¢ntului. Astfel, timpul de cÃ„ï¿½utare nu depinde de numÃ„ï¿½rul de cuvinte pe care trebuie sÃ„ï¿½ ÃƒÂ®l gestioneze structura de date, fapt ce face aceastÃ„ï¿½ structurÃ„ï¿½ idealÃ„ï¿½ pentru implementarea dicÃ…Â£ionarelor.

infoarena informatica de performanta

Siruri de sufixe

Introducere

Ce sunt Ã…ï¿½irurile de sufixe (suffix arrays)?