[FUG-BR] [OT] Squid - Ordenação otimizada de conteúdo em ACL
Trober
trober em trober.com
Domingo Novembro 1 20:14:11 BRST 2009
> 2009/11/1 Trober <trober em trober.com>:
>>
>> Boa-tarde a todos :)
>>
>> Quero otimizar a busca do Squid por registros (domínios), dentro de ACLs
>> de arquivos textos, que contém ao todo 531.681 linhas, distribuídas em
>> 38
>> arquivos.
>>
>> Sabendo que existem diferentes algoritmos de busca, consultei o
>> código-fonte do Squid, com o objetivo de interpretar e adequar meus
>> arquivos à forma de busca empregada no Squid. Para isso, atualmente,
>> converto todos os caracteres dos arquivos texto para minúsculo com "tr",
>> elimino as linhas em branco com "sed", ordeno com "sort -f -b" e removo
>> duplicados com "uniq" (importante para evitar o conflito de duplicidade,
>> detectado na função da linha 2675 do "acl.c").
>>
>> No final de tudo, rodo um "squid -k parse", elimino eventuais "sujeiras"
>> e, se tudo estiver certo, um "-k reconfigure" para concluir.
>>
>> Como não tive muito êxito na análise do "acl.c" e no enfileiramento de
>> aclDumpDomainList, pergunto: qual a ordenação mais adequada compatível
>> com
>> o Squid?
>>
>> Muito grato!
>>
>> Bom feriado a todos.
>>
>> Saudações,
>>
>> Trober
>> -
>> -
>> -
>> -
>> -
>>
>> -------------------------
>> Histórico: http://www.fug.com.br/historico/html/freebsd/
>> Sair da lista: https://www.fug.com.br/mailman/listinfo/freebsd
>>
>
> Não seria mais interessante/prático (se é que eu entendi) você usar o
> squidguard ou dansguardian ?
>
> --
> Celso Vianna
> BSD User: 51318
> http://www.bsdcounter.org
>
> 63 8404-8559
> Palmas/TO
> -------------------------
>
Salve Celso! :)
Desculpe-me pela mensagem anterior. O gato pulou no teclado e enviou a
mensagem pela metade :S
Sim. Concordo que o uso de um banco de dados é melhor, mas não fui
autorizado a migrar :(
O problema da ordenação, é que eu recebo as listas de bloqueio prontas
da equipe de "parsing" (que revisa manualmente cada domínio).
As vezes vem na ordenação padrão do Excel, às vezes do OpenOffice, e ambas
são ordenações carnavalescas, no que refere-se ao tratamento de caracteres
especiais (hífens, underlines etc).
A intenção é saber qual é a ordem utilizada no Squid, para tratamento de
ordenação de strings.
Por exemplo:
.45-testededominio.com
.45outroteste.com
Dependendo do programa, a ordenação é:
.45outroteste.com
.45-testededominio.com
A dúvida é saber como é o tratamento de ordenação do Squid. Consultei nos
fontes e não tive êxito.
Saudações,
Trober
-
-
-
-
-
Mais detalhes sobre a lista de discussão freebsd