Publicidade
Repórter News - www.reporternews.com.br
Tecnologia
Domingo - 04 de Novembro de 2012 às 17:44

    Imprimir


Reuters

Já é possível prever com antecedência quais seão os Assuntos do Momento (Trending Topics) do Twitter. Um professor e um aluno do Massachussets Institute of Technology (MIT) descobriram um algoritmo que pode apontar, com 95% de precisão, quais os temas serão os mais populares no microblog com antedendência média de uma hora e meia antes do algoritmo do Twitter colocar o assunto nessa lista. Em alguns casos, o novo algoritmo pode se antecipar ao do microblog em até cinco horas.

A descoberta do professor Devavrat Shah e do estudante Stanislav Nikolov pode ser de relevância para o Twitter, que pode explorar possibilidades comerciais a partir da antecipação de assuntos populares, como a venda de anúncios relacionados a temas que entrarão para a lista dos mais comentados do momento. O algoritmo também representa uma nova abordagem em análises estatísticas, já que, em teoria, pode ser aplicado a qualquer número que varie ao longo do tempo como a duração de uma viagem, a venda de ingressos para o cinema e provavelmente até preço de ações na bolsa.

Como todo algoritmo, o desenvolvido por Shah e Nikolov precisa ser treinado, o que significa especificar determinados padrões a serem considerados. "É um modelo muito simplista", define o professor, explicando que eles buscam treinar o algoritmo com base em dados identificar um grande "salto", de popularidade no caso do tweets, e acompanhar como esse grande salto acontece. O problema, segundo Shah, é que "há mil coisas que poderiam acontecer", portanto, ele e o aluno tem deixado que "os dados decidam".

Em seus experimentos, a dupla montou um treinamento do algoritmo definindo 200 assuntos no Twitter que mostravam popularidade e outros 200 que não. Em tempo real, o sistema mostrou 95% de acertos em relação às publicações. Mas Shah diz que a precisão do sistema deve melhorar conforme se aumente as especificações de treinamento do algoritmo quanto à quantidade de dados a serem considerados, o que significa necessidade de mais recursos de computação.





Fonte: Terra

Comentários

Deixe seu Comentário

URL Fonte: https://www.reporternews.com.br/noticia/36999/visualizar/