Diferente pentru introducere-in-asamblare intre reviziile #26 si #37

Nu exista diferente intre titluri.

Diferente intre continut:

h1. Introducere in asamblare
(Categoria _Limbaje_, autor(i) _Botau Cristian_)
(Categoria _Limbaje de programare_, Autor _Cristian Botau_)
 
(toc){width: 35em}*{text-align:center} *Conţinut:*
* 'Limbajul de asamblare: avantaje si dezavantaje in folosirea lui':introducere-in-asamblare#limbajul-de-asamblare
** 'Avantaje ale limbajului de asamblare':introducere-in-asamblare#avantaje-limbaj-asamblare
** 'Dezavantaje ale limbajului de asamblare':introducere-in-asamblare#dezavantaje-limbaj-asamblare
* 'Notiuni de baza ale limbajului de asamblare':introducere-in-asamblare#notiuni-de-baza
** 'Registrii':introducere-in-asamblare#registrii
*** 'Registrii de uz general':introducere-in-asamblare#registrii-de-uz-general
*** 'Registrii de segment si index':introducere-in-asamblare#registrii-de-segment-si-index
*** 'Registrii speciali':introducere-in-asamblare#registrii-speciali
*** 'Flagurile microprocesorului':introducere-in-asamblare#flagurile-microprocesorului
** 'Instructiunile de baza ale microprocesorului 8086':introducere-in-asamblare#instructiuni-de-baza-8086
*** 'Instructiunea MOV':introducere-in-asamblare#instructiune-MOV
*** 'Instructiuni aritmetice. Instructiunile ADD, SUB, INC, DEC':introducere-in-asamblare#instructiuni-aritmetice
*** 'Instructiuni pe biti. Instructiunile AND, TEST, OR, XOR, NOT':introducere-in-asamblare#instructiuni-pe-biti
*** 'Instructiunile PUSH/POP':introducere-in-asamblare#instructiuni-PUSH-POP
*** 'Instructiunea CMP':introducere-in-asamblare#instructiune-CMP
*** 'Jump-urile neconditionate (JMP) si jump-urile conditionate (JE, JNE, JB, JBE, JA, JAE, JZ, JNZ)':introducere-in-asamblare#jumpuri
*** 'Instructiunea LOOP':introducere-in-asamblare#instructiune-loop
*** 'Instructiunea INT':introducere-in-asamblare#instructiune-INT
* 'Transcrierea unor instructiuni C/PASCAL in asamblare':introducere-in-asamblare#instructiuni-CPascal-in-asamblare
** 'IF cond THEN instr':introducere-in-asamblare#if-then
** 'IF cond THEN instr1 ELSE instr2':introducere-in-asamblare#if-then-else
** 'DO { inst } WHILE':introducere-in-asamblare#do-while
* 'Program demonstrativ':introducere-in-asamblare#program-demonstrativ
* 'Linkuri':introducere-in-asamblare#linkuri
* 'Doua cuvinte conclusive...':introducere-in-asamblare#concluzie
Acest articol prezinta un limbaj mai putin folosit : limbajul de asamblare. Este folosit de cele mai multe ori pentru marirea vitezei de rulare a programelor. In prima sectiune sunt prezentate cateva avantaje / dezavantaje in folosirea acestui limbaj, iar ulterior sunt definite notiunile elementare ce trebuie stiute inainte de a trece la tratarea limbajului propriu-zis. De asemenea, sunt prezentate cateva intructiuni si transcrieri ale unor structuri din C/Pascal in limbaj de asamblare. In final sunt comparati timpii de executie intre varianta pascal si varianta assembler ale unei proceduri de {$Bubble Sort$}.
h2. Limbajul de asamblare : avantaje si dezavantaje in folosirea lui
Limbajul de asamblare pe mediul x86 exista in doua tipuri de sintaxe :
 
* Intel
* AT&T
 
Sintaxa depinde de compilatorul folosit. De exemplu: Turbo Assembler (inclus in pachetul BC3.1) si Netwide Assembler (NASM) folosesc sintaxa Intel. GAS (folosit de GCC) foloseste sintaxa AT&T.
Nota: In GCC se poate folosi si sintaxa Intel, detalii 'aici':http://en.wikipedia.org/wiki/GNU_Assembler#Criticism .
 
 
O alta diferenta importanta este felul in care este interpretat cuvantul cheie _asm_ in diferite compilatoare C/C++.
De exemplu, aceeasi instructiune in mediul Borland, si GCC cu cele 2 sintaxe :
 
*Borland C 3.1 (sau TASM)*
== code(cpp) |asm { mov ax, bx };
==
 
*GCC (sintaxa AT&T)*
== code(cpp) |asm ("mov %bx, %ax");
==
 
*GCC (sintaxa Intel)*
== code(cpp) |asm (".intel_syntax noprefix\n\t"
     "mov ax, bx");
==
 
 
Exemplele prezentate in acest articol sunt scrise in sintaxa Intel.
 
h2(#limbajul-de-asamblare). Limbajul de asamblare : avantaje si dezavantaje in folosirea lui
Desi este unul dintre cele mai vechi limbaje de programare, limbajul de asamblare este incorporat si in cele mai noi compilatoare cum ar fi Visual C++ si Delphi. Codul de asamblare este foarte apropiat de codul executabil al programelor, asamblorul avand rolul de a codifica instructiunile din limbaj de asamblare in cod masina.
In prezent, limbajul de asamblare este din ce in ce mai putin folosit in scrierea programelor, deoarece compilatoarele de ultima generatie au functiile cele mai folosite de programatori deja scrise si optimizate in limbaj de asamblare (gen memmove, memset / fillchar, etc.) incluse in unit-uri si biblioteci. Bineinteles, daca se doreste atingerea unor timpi de executie foarte mici, folosirea limbajului de asamblare este preferabila (cand avem algoritmul de complexitate optima).
h3. Avantaje ale limbajului de asamblare
h3(#avantaje-limbaj-asamblare). Avantaje ale limbajului de asamblare
* Viteza foarte mare de executie a programelor (unele programe scrise si optimizate in asamblare au viteza de executie pana la 5-10 de ori mai mare decat cele scrise in C sau Pascal);
* Marimea codului executabil este foarte mica;
* Ajuta utilizatorul sa inteleaga mai bine cum functioneaza microprocesorul si sa scrie programe eficiente si in High Level Languages.
h3. Dezavantaje ale limbajului de asamblare
h3(#dezavantaje-limbaj-asamblare). Dezavantaje ale limbajului de asamblare
* nu este portabil; un program scris pentru calculatoare IBM PC nu va rula pe un Apple Macintosh (difera unele instructiuni);
* un program in asamblare este mai greu de scris si ia mai mult timp decat un program scris in Pascal sau C;
Majoritatea compilatoarelor din prezent permit programatorului sa scrie anumite parti de cod sau subprograme in asamblare, astfel incat programatorul sa poata scrie in asamblare doar partea din program care se executa de cele mai multe ori, programul ruland astfel mult mai rapid. Sunt si compilatoare dedicate exclusiv limbajului de asamblare, cum ar fi TASM - Turbo Assembler (il gasiti in directorul BP/Bin), MASM - Microsoft Assembler, etc.
Pentru a scrie o secventa de limbaj de asamblare intr-un program C se foloseste cuvantul rezervat asm :
Pentru a scrie o secventa de limbaj de asamblare intr-un program $C$ se foloseste cuvantul rezervat $asm$ :
== code(cpp) |asm { instructiuni in asamblare };
==
end.
==
h2. Notiuni de baza ale limbajului de asamblare
h2(#notiuni-de-baza). Notiuni de baza ale limbajului de asamblare
h3. Registrii
h3(#registrii). Registrii
Limbajul de asamblare este foarte apropiat de codul executabil, deci pentru ca programatorul sa fie capabil sa scrie codul in asamblare trebuie sa cunoasca modul in care functioneaza microprocesorul si modul in care acesta executa instructiunile.
Registrii de uz general sunt folositi in executia operatiilor aritmetice si logice. Registrii de segment si cei index sunt folositi in adresarea memoriei, iar cei speciali sunt folositi de microprocesor si S.O. pentru rularea programelor.
h4. Registrii de uz general
h4(#registrii-de-uz-general). Registrii de uz general
Acestia sunt :
Registrii precedati de prefixul "{$e$}" sunt pe $32$ de biti, deci pot fi tratati ca si variabile {$unsigned long$}/{$signed long$} ({$doubleword$}). Acestia pot fi folositi si ca registri pe $16$ biti ({$word$}) sau pe $8$ biti ({$byte$}) prin intermediul "subregistrilor" : {$ax$}, {$bx$}, {$cx$}, $dx$ (reprezinta word-ul nesemnificativ = cel din dreapta)., {$ah$}, {$bh$}, {$ch$}, $dh$ (byte-ul cel mai semnificativ al {$ax$}, {$bx$}, {$cx$}, {$dx$}), {$al$}, {$bl$}, {$cl$}, {$dl$}(registrii pe 8 biti).
h4. Registrii de segment si index
h4(#registrii-de-segment-si-index). Registrii de segment si index
Acesti registri sunt folositi la adresarea memoriei.
De exemplu
Va sfatuiesc sa NU incercati sa modificati urmatorii registri : $cs$ (care contine segmentul la care se afla incarcat codul executabilului, $ss$ contine segmentul de memorie in care se afla stiva sistemului).
h4. Registrii speciali
h4(#registrii-speciali). Registrii speciali
Sunt folositi foarte rar in scrierea efectiva a programelor, deci nu veti accesa prea des acesti registri.De exemplu, $ip$ (instruction pointer) care retine adresa (de fapt offset-ul) la care se afla instructiunea care urmeaza sa fie executata.
h4. Flagurile microprocesorului
h4(#flagurile-microprocesorului). Flagurile microprocesorului
Flag-urile microprocesorului sunt asemanatoare unor variabile boolene. Cu ajutorul lor putem afla rezultatul unei comparatii sau daca o operatie a produs "overflow", etc. Aceste flag-uri nu pot fi accesate direct ca si registrii, ci testarea daca un flag este activat se face prin intermediul "jump"-urilor conditionate.(vezi instructiunea {$cmp$}).
Fie {$ax = 1$}. Decrementarea lui $ax$ cu $1$ va duce la activarea flagului numit Zero-Flag.(rezultatul operatiei a fost {$0$}).
Fie {$ax = 65535$} ({$0xFFFF$}). Incrementarea lui $ax$ cu $2$ va duce la setarea flagului numit Overflow-Flag (rezultatul operatiei nu "incape" in $16$ biti);
h3. Instructiunile de baza ale microprocesorului 8086 :
h3(#instructiuni-de-baza-8086). Instructiunile de baza ale microprocesorului 8086
Sunt folosite urmatoarele prescurtari :
* {$imm8$}/ {$imm16$}/ {$imm32$} - se refera la valori imediate (constante);
* {$mem8$}/ {$mem16$}/ {$mem32$} - zona memorie de memorie sau variabile pe {$8$}/{$16$}/{$32$} biti;
h4. Instructiunea MOV
h4(#instructiune-MOV). Instructiunea MOV
h5. Sintaxa
_Sintaxa_:
* $mov dest, source$ // echivalenta cu dest = source
h5. Variante
_Variante_:
* $mov reg8/16/32, mem8/16/32$
* $mov reg8/16/32, reg8/16/32$
* $mov reg8/16/32, imm8/16/32$
* $mov mem8/16/32, imm8/16/32$
h5. Descriere
_Descriere_:
Instructiunea copiaza o valoare dintr-o locatie in alta locatie. Aceasta locatie poate fi zona de memorie, variabila, registru. De retinut este ca nu exista variante ale instructiunii care copiaza direct dintr-o zona de memorie in alta.
h5. Flaguri afectate
_Flaguri afectate_:
Instructiunea mov nu modifica nici un flag.
h5. Restrictii
_Restrictii_:
Ambii operanzi trebuie sa aiba aceeasi marime. De exemplu pentru ultima varianta a instructiunii mov trebuie specificata marimea zonei de memorie. Instructiunea "mov [bx], 0" nu este corecta deoarece compilatorul nu stie ce vrea sa faca instructiunea: sa copieze valoarea 0 in byte-ul, in word-ul sau in doubleword-ul de la adresa bx. Astfel variantele corecte sunt:
mov dword ptr [bx], 0
==
h5. Exemplu
_Exemplu_:
== code(cpp) |mov ax, 3 // ax = 3
mov bx, ax // bx = ax
==
h4. Instructiuni aritmetice. Instructiunile ADD, SUB, INC, DEC
h4(#instructiuni-aritmetice). Instructiuni aritmetice. Instructiunile ADD, SUB, INC, DEC
h5. Sintaxa
_Sintaxa_:
* $add dest, source$ // echivalenta cu dest+=source
* $sub dest, source$ // echivalenta cu dest-=source
* $inc dest$ // echivalenta cu dest++
* $dec dest$ // echivalenta cu dest--
h5. Variante
_Variante_:
* $add(sub) reg8/16/32, mem8/16/32$
* $add(sub) reg8/16/32, reg8/16/32$
* $add(sub) reg8/16/32, imm8/16/32$
* $add(sub) mem8/16/32, imm8/16/32$
h5. Descriere
_Descriere_:
Instructiunea "{$add$}" este folosita pentru a aduna doua valori, "{$sub$}" pentru a scadea o valoare din alta, "{$inc$}" - incrementarea unei variabile, "{$dec$}" - decrementarea unei variabile (registru/memorie).
h5. Flaguri afectate
_Flaguri afectate_:
* $carry flag$ - pentru "signed overflow"
* $overflow flag$ - pentru overflow
* $zero flag$ - activat daca rezultatul operatiei a fost 0
* $parity flag$ - este setat in functie de paritatea rezultatului
h5. Restrictii
_Restrictii_:
Destinatia trebuie sa aiba aceeasi marime ca si sursa.
h5. Exemplu
_Exemplu_:
== code(cpp) |mov ax, 3 // ax = 3
add bx, ax // bx = ax+3
==
h4. Instructiuni pe biti. Instructiunile AND, TEST, OR, XOR, NOT
h4(#instructiuni-pe-biti). Instructiuni pe biti. Instructiunile AND, TEST, OR, XOR, NOT
h5. Sintaxa
_Sintaxa_:
* $and dest, source$ // echivalenta cu dest&=source
* $test dest, source$ // dest & source
* $xor dest, source$ // echivalenta cu dest^=source
* $not dest$ // ~dest
h5. Variante
_Variante_:
Pentru "{$and$}", "{$or$}", "{$test$}", "{$xor$}" sunt ca si cele de la "{$add$}". Pentru "{$not$}" avem doua variante :
* $not reg8/16/32$
* $not mem$
h5. Descriere
_Descriere_:
Executa operatiile pe biti corespunzatoare. Instructiunea test (non-destructive and) este asemanatoare lui and, dar nu afecteaza rezultatul ci doar flagurile.
h5. Flaguri afectate
_Flaguri afectate_:
Instructiunea "{$not$}" nu afecteaza nici un flag.
Flagurile afectate de celalalte instructiuni sunt :
* $zero flag$ - activat daca rezultatul operatiei a fost 0
* $parity flag$ - este setat in functie de paritatea rezultatului
h5. Restrictii
_Restrictii_:
Destinatia trebuie sa aiba aceeasi marime ca si sursa.
Instructinile $OR/XOR/INC/DEC$ modifica flag-urile microprocesorului: {$Carry$}(numai {$ADD/SUB$}), {$Overflow$}, {$Zero$}, {$Parity$}.
h5. Exemplu
_Exemplu_:
== code(cpp) |mov ax, 5 // ax = 3
test ax, 1 // daca (ax & 1)
and bx, FFFEh // bx = bx & 0xFFFE (se sterge bitul cel mai nesemnificativ)
==
h4. Instructiunile PUSH/POP
h4(#instructiuni-PUSH-POP). Instructiunile PUSH/POP
h5. Descriere
_Descriere_:
Aceste instructiuni sunt folosite pentru accesarea stivei sistemului. Instructiunea PUSH pune pe stiva sistemului o valoare, iar instructiunea POP extrage valoarea din varful stivei.
h5. Sintaxa
_Sintaxa_:
* $push val$
* $pop val$
h5. Variante
_Variante_:
* $push reg8/16/32$
* $pop reg8/16/32$
h5. Exemplu
_Exemplu_:
== code(cpp) |@lp:
push cx // salvam valoarea cx
jnz @lp // daca (cx != 0) atunci sari inapoi la @lp
==
h4. Instructiunea CMP
h4(#instructiune-CMP). Instructiunea CMP
h5. Descriere
_Descriere_:
Compara doua valori si seteaza flag-urile microprocesorului cu rezultatele compararii. De cele mai multe ori este folosita in combinatie cu jump-urile (vezi mai jos).
h5. Sintaxa
_Sintaxa_:
* $cmp val1, val2$
h5. Variante
_Variante_:
* $cmp reg8/16/32, reg8/16/32$
* $cmp reg8/16/32, imm8/16/32$
* $cmp mem8/16/32, reg8/16/32$
* $cmp mem8/16/32, imm8/16/32$
h4. Jump-urile neconditionate (JMP) si jump-urile conditionate (JE, JNE, JB, JBE, JA, JAE, JZ, JNZ)
h4(#jumpuri). Jump-urile neconditionate (JMP) si jump-urile conditionate (JE, JNE, JB, JBE, JA, JAE, JZ, JNZ)
Aceste instructiuni sunt folosite pentru generarea instructiunilor If /while do /do while /repeat /for.Sunt asemanatoare instructiunii goto din C/Pascal.
h5. Sintaxa
_Sintaxa_:
$instructiune label$
* $JNZ$ * "sare" cu executia programului la label daca flag-ul zero nu este setat;
* $JMP$ * "sare" cu executia programului la label;
h5. Exemplu
_Exemplu_:
== code(cpp) |mov ax, 1
@loop :
    // compara ax cu valoarea 10 si seteaza flagurile
    cmp ax, 10
    // daca ax != 10 sari inapoi la @loop
 
jne @loop
== code(cpp) |instr1
In ultimul exemplu instr2 si instr3 nu vor fi executate deoarece inaintea lor se afla instructiunea jump care face ca programul sa sara cu executia la instructiunea imediat urmatoare etichetei "label1".
h4. Instructiunea LOOP
h4(#instructiune-loop). Instructiunea LOOP
Instructiunea "loop" este folosita de obicei in transcrierea for-urilor si a buclelor.
h5. Sintaxa
_Sintaxa_:
* $loop label$
h5. Descriere
_Descriere_:
Echivalenta cu :
jz label
==
h4. Instructiunea INT
h4(#instructiune-INT). Instructiunea INT
h5. Descriere
_Descriere_:
Instructiunea INT apealeaza o intrerupere.
h5. Sintaxa
_Sintaxa_:
* $INT nr_intrerupere$ (un numar cuprins intre 0 si 255);
Intreruperile opresc programul din rulare, executa un anumit cod si apoi permit continuarea rularii programului. Cu ajutorul apelului intreruperilor aplicatia poate sa comunice cu sistemul de operare, si cu unele componente hardware ale calculatorului (mouse-ul, tastatura, imprimanta, etc). Fiecare intrerupere are asociat un numar.
h5. Exemple
_Exemple_:
* $0x9$ : intreruperea pentru tastatura;
* $0x10$ : intreruperea care ofera serviciile BIOS pentru accesul la placa video;
}
==
h2. Transcrierea unor instructiuni C/PASCAL in asamblare
h2(#instructiuni-CPascal-in-asamblare). Transcrierea unor instructiuni C/PASCAL in asamblare
h3. IF cond THEN instr
h3(#if-then). IF cond THEN instr
Exemplu :
@skip_if :
==
h3. IF cond THEN instr1 ELSE instr2
h3(#if-then-else). IF cond THEN instr1 ELSE instr2
Exemplu:
==
h3. DO { inst } WHILE
h3(#do-while). DO { inst } WHILE
Exemplu :
In codul de mai sus (prima varianta) puteti observa cateva mici optimizari : retinerea variabilelor in registri (accesul la registri este mult mai rapid decat la memorie), inlocuirea instructiunii {$mov reg, 0$ cu {$xor reg, reg$}. Varianta "xor" este mai rapida (desi $mov$ si $xor$ "teoretic" au tot atatea ceasuri de procesor) deoarece instructiunea $mov reg, 0$ transcrisa in cod masina este mai "lunga" (are cu $2-4$ bytes mai mult decat {$xor reg, reg$}). Aceeasi regula se aplica si in cazul "{$or reg, reg$}" in testarea daca valoarea unui registru este egala cu {$0$}, intrucat instructiunea "{$or$}" modifica flagurile procesorului ({$ZeroFlag$}). O alta optimizare este folosirea registrului $ax$ pentru calcule (in majoritatea cazurilor instructiunile care folosesc registrul $(e)ax$ sunt mai rapide).
h2. Program demonstrativ
h2(#program-demonstrativ). Program demonstrativ
Exemplu de functie in realizata in C/Asamblare (compilator folosit BC++ 3.1):
		// cx = n;
		mov cx, n
		// cx = n-1
 
		dec cx
		// ax = a[0]
		mov ax, es:[di]
==
Output program pascal (pe pc-ul meu: Duron $750$ Mhz):
$100$ rulari ale bsort in asamblare au rulat in : $1.263$ secunde
$100$ rulari ale bsort obisnuit au rulat in : $4.614$ secunde
 
De precizat este ca nu am optimizat programul aproape deloc (am transcris codul din pascal in asm). Cu optimizari "hardcore" se pot obtine timpi mult mai buni. Diferenta dintre varianta asm si varianta high level language este mai mica pe compilatoarele mai noi, cum ar fi GCC sau FreePascal deoarece acestea stiu genera un cod mai optimizat. Totusi, nici un compilator nu poate bate creierul uman.
h2. Linkuri
* $100$ rulari ale bsort in asamblare au rulat in : $1.263$ secunde
* $100$ rulari ale bsort obisnuit au rulat in : $4.614$ secunde
"Link #1":http://www.arl.wustl.edu/~lockwood/class/cs306/books/
"Link #2":http://artofasm/toc.html
De precizat este ca nu am optimizat programul aproape deloc (am transcris codul din pascal in asm). Cu optimizari "hardcore" se pot obtine timpi mult mai buni. Diferenta dintre varianta asm si varianta high level language este mai mica pe compilatoarele mai noi, cum ar fi GCC sau FreePascal deoarece acestea stiu genera un cod mai optimizat. Totusi, nici un compilator nu poate bate creierul uman.
Cartea "The Art of Assembly Language Programming". Este detaliata. Foarte buna atat pentru incepatori cat si pentru avansati.
h2(#linkuri). Linkuri
"Link #3":http://www.goof.com/pcg/doc/pentopt.txt
* '_The Art of Assembly Language_':http://www.scribd.com/doc/6498072/Art-of-Assembly. O carte detaliata si foarte buna atat pentru incepatori cat si pentru avansati.
Un tutorial bun pentru optimizarea programelor in asamblare pentru procesoarele din familia Pentium. Tutorialul este pentru avansati.
* '_How to optimize for the Pentium processor_':http://www.goof.com/pcg/doc/pentopt.txt. Un tutorial bun pentru optimizarea programelor in asamblare pentru procesoarele din familia Pentium. Tutorialul este pentru avansati.
"Link #4":http://www.techtutorials.info/assembly.html
* '_Assembly Tutorials_':http://www.techtutorials.info/assembly.html. Mai multe tutoriale despre assembly language.
Mai multe tutoriale despre assembly language.
h2(#concluzie). Doua cuvinte conclusive...
h2. Doua cuvinte conclusive...
Acest articol trateaza "bazele" programarii in asamblare, dupa cum ii zice numele este doar o introducere. Pentru a sti sa programezi in _asm_, trebuie invatate mult mai multe lucruri. Scopul articolului este de a starni interesul cititorilor si de a le oferi o imagine asupra acestui limbaj. Cei ce doresc sa invete mai multe despre _assembly language_ sunt invitati sa citeasca cartile / tutorialele din sectiunea 'linkuri':introducere-in-asamblare#linkuri.
Acest articol trateaza "bazele" programarii in asamblare, dupa cum ii zice numele este doar o introducere. Pentru a sti sa programezi in asm, trebuie invatate mult mai multe lucruri. Scopul articolului este de a starni interesul cititorilor si de a le oferi o imagine asupra acestui limbaj. Cei ce doresc sa invete mai multe despre assembly language sunt invitati sa citeasca cartile / tutorialele din sectiunea linkuri.

Nu exista diferente intre securitate.

Diferente intre topic forum:

 
3676