⚡ Desenrolamento de Laço (Loop Unrolling) ⚡

Técnica de ILP (Instruction Level Paralelism -> Paralelismo em Nível de Instrução) que busca alcançar maiores velocidades de execução de software.

Sumário

ILP
Loop Unrolling
Colocando em Prática
Por Que Funciona?
Conclusão

ILP

Paralelismo em nível de instrução é a ideia de paralelizar instruções, ou seja, executar processos simultaneamente no processador. Existem diversas técnicas de ILP, porém aqui será dado o foco para o loop unrolling.

Loop Unrolling

O loop unrolling é uma das várias técnicas de ILP que visa maior velocidade de execução de código e redução de consumo, através do desenrolamento de iterações. Matematicamente, podemos dizer que uma iteração M pode ser desenrolada N vezes, ou seja, também pode se dizer que é uma iteração M/N. Além disso pode ser aplicada:

Estaticamente: onde o programador implementa a técnica por sí próprio ou "na unha" como chamam.
Dinamicamente: de maneira automatizada, utilizando compiladores JIT (operam em tempo de execução). Nesse caso, o cenário ideal para aplicação, é quando temos um array que tem um tamanho desconhecido antes da compilação ou que pode ser definido/alterado durante execução.

Já que é nas iterações que esse método atua, é possível utilizar em for, while e lista encadeada. Será detalhado a seguir em pseudocódigo, como é possível converter as iterações convencionais para loop unrolling.

For

Aqui teremos um exemplo de como funciona a conversão de um for convencional para um fatorado usando a técnica abordada:

//For convencional

for(i=0;i<1000;i++){
  a[i]=0;
}

//For com loop unrolling aplicado

for(i=0;i<1000;i+=10){
  a[i] = 0;
  a[i+1] = 0;
  a[i+2] = 0;
  a[i+3] = 0;
  a[i+4] = 0;
  a[i+5] = 0;
  a[i+6] = 0;
  a[i+7] = 0;
  a[i+8] = 0;
  a[i+9] = 0;
}

While

Não é muito diferente do for, muda a sintaxe, porém, a lógica permanece a mesma:

//While convencional

i=0;

while(i<1000){
  a[i]=0;

  i++;
}

//While com loop unrolling aplicado

i=0;

for(i<1000){
  a[i] = 0;
  a[i+1] = 0;
  a[i+2] = 0;
  a[i+3] = 0;
  a[i+4] = 0;
  a[i+5] = 0;
  a[i+6] = 0;
  a[i+7] = 0;
  a[i+8] = 0;
  a[i+9] = 0;

  i+=10;
}

Lista Encadeada ⚠️ (Precisa ser implementada no exemplo ainda!)

Em uma lista encadeada, percorremos os nós pelo ponteiros que apontam para o próximo nó, artigo base cita uma solução onde é criado dois fluxos de iteração, ambos partindo das extremidades da lista. Porém, para isso acontecer, é preciso alterar a estrutura de dados do nó, para armazenar além da chave e do próximo, incluir o anterior também (é esse que faz com que seja possível vir do final para o início), de forma que passe a ser uma lista dupalmente encadeada.

//lista encadeada convencional

count = 0;

node f = first;

while(f != NULL){
  f = f->next;

  count++;
}

//lista encadeada com loop unrolling aplicado

count = 0;

node f = first;
node l = last;

while((f != l) || (f->next != l)){
  f = f->next;
  l = l->prev;

  count+=2;
}

if(f == l) {
  count--;
}

Colocando em Prática

Primeiro faça o download de um compilador C++ (recomendado Dev-C++);
Após a instalação, faça o download do código fonte;
Abra o Dev-C++ e nele abra o arquivo .cpp baixado;
Clique no ícone compilar & executar;
Nisso um terminal em que aparecerá o tempo de execução de do código não fatorado e do código fatorado (o tempo de execução pode variar dependendo da comfiguração da sua máquina);

Por que funciona?

Em nível de instrução, o cabeçalho do for se repete toda vez que é feito um loop, ou seja, a comparação para checar se é para encerrar ou continuar a execução do escopo é repetida. Quando utilizamos o loop unrollling, as declarações desse cabeçalho é diminuído em N vezes, no caso do exemplo do for demonstrado anteriormente, é diminuído em 10 vezes.

Conclusão

Assim como há prós, há contras:

Prós

Velocidade de execução aumentada;
Penalidade de predição de branches é diminuída;
Quando não existe dependência entre os processos, estes podem ser paralelisáveis, é o caso do exemplo prático.
Pode haver implementação de modo dinâmico, especialmente quando o tamanho do array não é fixo,

Contras

Aumento do tamanho do programa (o que pode não ser interessante em sistemas embarcados);
Perda de cache em instrução;
Se o processo não for feito de modo dinâmico, o código acaba por ficar menos legível e mais difícil de manutenir;

Apesar dos contras, ainda é possível extrair benefícios para diversas aplicações, sempre tendo em mente o trade-off que existe por trás, antes de tomar a decisão da utilização da técnica.

Name		Name	Last commit message	Last commit date
Latest commit History 11 Commits
LICENSE		LICENSE
README.md		README.md
teste.cpp		teste.cpp

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

⚡ Desenrolamento de Laço (Loop Unrolling) ⚡

Sumário

ILP

Loop Unrolling

For

While

Lista Encadeada ⚠️ (Precisa ser implementada no exemplo ainda!)

Colocando em Prática

Por que funciona?

Conclusão

Prós

Contras

About

Releases

Packages

Languages

License

Gabao-Farias/Desenrolamento-de-Laco

Folders and files

Latest commit

History

Repository files navigation

⚡ Desenrolamento de Laço (Loop Unrolling) ⚡

Sumário

ILP

Loop Unrolling

For

While

Lista Encadeada ⚠️ (Precisa ser implementada no exemplo ainda!)

Colocando em Prática

Por que funciona?

Conclusão

Prós

Contras

About

Resources

License

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages