[Date Prev][Date Next] [Thread Prev][Thread Next] [Date Index] [Thread Index]

Re: renomear pastas com caracteres invalidos.



On Mon, Sep 15, 2008 at 03:25:49PM -0300, hamacker wrote:
> O unico comando que descobri via google que pode descobrir a
> codificacao de um arquivo é o 'auto_ef', mas ele é para solaris. Mas
> se houvesse outro similar eu poderia identificar os arquivos problemas
> e fazer o convmv só neles.

Até onde eu saiba, não é possível determinar com certeza qual a
codificação de um arquivo, e muito menos de um nome de arquivo. O
problema é que quase todos os valores são válidos dentro de quase
todas as codificações. Por exemplo, se pego o nome de arquivo "ação",
já em utf8, e o converto como se estivesse em iso8859-1, terei
"ação". Para o computador, os dois nomes são igualmente válidos. Se
todos os arquivos usarem palavras em português, você poderia tentar
usar um dicionário, mas em geral não é o caso.

Se em cada diretório todos os arquivos tiverem a mesma codificação,
você pode usar um comando como "ls | file", pois o file tem um
algoritmo para tentar encontrar a codificação, baseando-se em certos
caracteres que são inválidos em certas codificações. Se os arquivos
estiverem realmente misturados fica muito difícil, pois a quantidade
de letras em cada arquivo é muito pequena para ter certeza da
codificação.

Tiago.


Reply to: