quinta-feira, 23 de julho de 2009

A web do futuro é semântica?

A construção de uma internet mais inteligente caminha devagar, mas pode provocar uma revolução.

Esqueça o Google. Se a web semântica virar mesmo realidade, o futuro estará repleto de agentes — programas capazes de pesquisar informações e executar tarefas complexas, que, hoje, apenas os humanos conseguem realizar. Um exemplo: usar a rede para alugar um apartamento em São Paulo, num prédio sem restrições a cachorros, numa rua com baixo índice de criminalidade e a, no máximo, 20 minutos de carro do trabalho. Hoje, uma pesquisa desse tipo exige que o internauta passe algumas horas diante do PC. É necessário visitar vários sites, decidir quais informações têm maior ou menor relevância e tirar conclusões. Com a web semântica, todo o trabalho duro ficará sob a responsabilidade de aplicativos. Eles não apenas conseguirão dar a resposta em poucos segundos como também serão capazes de entrar em contato com as imobiliárias.

Quem idealizou esse cenário foi o pai da web, o físico Tim Berners-Lee, diretor do World Wide Web Consortium (W3C). Mas o projeto de uma internet mais inteligente, que surgiu há mais de dez anos, até agora não decolou. Apesar de padrões e modelos já terem sido definidos e criados há algum tempo, ainda são poucos os sites moldados dentro dos novos parâmetros. Enquanto isso, buscadores como o Google continuam indispensáveis. O que aconteceu?

Teia na rede

Não dá para entender por que a web semântica ainda não se tornou um grande sucesso sem compreender o seu funcionamento. São muitas as diferenças em relação à rede atual. A internet de hoje consiste numa imensa quantidade de documentos, que só se relacionam entre si por meio de links. Quando leem o código de uma página, os computadores veem apenas um punhado de instruções que indicam como exibi-la de modo correto.

No caso de uma livraria virtual, as máquinas não sabem diferenciar preço, título ou autor. Num site pessoal que exibe uma biografia, também não conseguem distinguir a cidade onde a pessoa nasceu das empresas onde trabalhou. Para um computador, cada aspecto desse conteúdo se resume a um conjunto de caracteres. Já a mente humana consegue perceber claramente cada elemento e seu significado.

A web semântica tem o objetivo de fazer os computadores também entenderem o que está descrito nas páginas da web. Na visão de Tim Berners-Lee e de outros pesquisadores, realizar essa mudança radical não exige a criação de complexos programas de inteligência artificial. O grande segredo está em produzir páginas que contenham, no seu código, informações capazes de indicar, às máquinas, o que representa cada item presente.

Para que a web semântica se concretize, é preciso que os dados sejam acompanhados de descrições baseadas nos padrões do W3C. Entre esses padrões, os principais são XML, RDF e ontologias (veja o glossário na página 60). Por meio desses códigos, os computadores vão identificar o que representa um nome, um endereço, uma cidade e assim por diante. Eles não vão se tornar mais espertos e realmente compreender, como o cérebro humano, o significado de cada coisa. Mas essa camada adicional de conteúdo permitirá a ação de programas especiais, os agentes, para lidar com informações e executar tarefas.

Admirável mundo novo

Berners-Lee e os pesquisadores James Hendler e Ora Lassila descreveram o que esperavam da web semântica num artigo publicado em 2001 na revista Scientific American (http://tinyurl.com/dytfbz). No texto, que se tornou referência, os agentes não estão presentes apenas em computadores, mas também em dispositivos móveis. Logo no início, um telefone toca e o volume de todos os aparelhos sonoros é diminuído automaticamente. Depois, um programa recebe a missão de agendar sessões de fisioterapia. E seguem vários outros exemplos semelhantes.

Hendler, hoje professor do Instituto Politécnico Rensselaer, nos Estados Unidos, disse à INFO que faria poucas alterações no artigo original. "Teria deixado mais claro de que falávamos de semântica realmente muito simples e enfatizado o quanto ela pode nos levar longe", afi rma. "Muitos pensam que a web semântica depende de inteligência artificial, mas estão errados. Tem muito mais a ver com bancos de dados e aplicativos para a web."

Para o pesquisador, não é possível dizer que essa nova internet ainda não emplacou. "Programas na web que aplicam essas tecnologias em larga escala já existem há mais de dois anos, e muitos outros continuam a surgir", diz. "É uma tecnologia ligada à infraestrutura. As pessoas esperam ‘vê-la’, mas o que ela realmente tem feito é permitir que os desenvolvedores enriqueçam seus sites e integrem melhor as informações de diferentes páginas."

Para Vagner Diniz, coordenador-geral do escritório brasileiro do W3C, uma verdadeira revolução está prestes a acontecer. "Pelas experiências que temos visto, haverá uma mudança radical", afirma. "Mas isso não quer dizer que as velhas tecnologias vão deixar de funcionar." A web atual e a semântica vão, portanto, coexistir — daí a resistência de muitos pesquisadores em se referir a esse novo cenário pelo termo web 3.0. "Cada vez mais, os sites estão em conformidade com os novos padrões", diz Carlos Cecconi, analista de projetos do W3C no Brasil.

Dados invisíveis

Se a maioria das páginas da internet já incorporasse a lógica da web semântica, os buscadores poderiam oferecer resultados mais precisos e complexos. A equipe do recém-lançado Wolfram Alpha (http://info.abril.com.br/web20/322.shtml) teve de construir, de modo quase artesanal, uma base de dados de onde o serviço tira todas as suas respostas. Para garantir a confiabilidade das informações, elas não são extraídas em tempo real da rede. Mas, se a maior parte da internet já incorporasse os novos padrões e modelos do W3C, o processo seria quase todo automatizado.

Apesar de a web semântica trazer benefícios, sua adoção ampla continua sendo uma promessa. "É a natureza humana", afirma Jon McLoone, desenvolvedor sênior da Wolfram Research. "Marcar as páginas exige esforço e, para muitos sites, não há recompensa." Ele vê, ainda, um alto grau de complexidade na tarefa, que poderia ser eliminado se ferramentas pudessem cuidar sozinhas da maior parte do trabalho. "Sem isso, a web semântica pode acontecer no ano que vem ou nunca", diz

A automatização parcial do processo também é vista como alternativa por Renato Fileto, professor da Universidade Federal de Santa Catarina (UFSC). "Uma das grandes dificuldades é a construção de ontologias", diz. Segundo ele, isso poderia ser facilitado por meio de aplicações baseadas em inteligência artificial. Fileto também acredita que ainda existe uma barreira no mundo corporativo. "Muitas vezes as empresas se recusam a adotar padrões por interesses comerciais", afirma.

Mas há lugares em que a web semântica está se tornando cada vez mais popular: as intranets. "Ali, ela está crescendo", diz José Parente de Oliveira, professor do Instituto Tecnológico de Aeronáutica (ITA). Sua adoção pode ter futuro também em outras áreas. Parente acha que as descrições semânticas podem ajudar a criar sistemas de análise de situação. Isso seria útil, por exemplo, no controle do tráfego aéreo. "Na internet, as coisas são mais lentas para acontecer", afirma o pesquisador. "As empresas precisam ver os benefícios que a web semântica traz", diz.

Vocabulário semântico

Conheça os principais padrões da web semântica:

XML (EXTENDED MARKUP LANGUAGE):

Linguagem para intercâmbio de dados. Permite, por exemplo, a criação de tags.

RDF (RESOURCE DESCRIPTION FRAMEWORK):

acrescenta contexto aos dados por meio de trios, marcadores semelhantes a sujeito, verbo e objeto de uma frase.

ONTOLOGIA:

descrição de termos e das relações semânticas entre eles. Permite identificar conceitos similares descritos de forma diferente.

 

Nenhum comentário: