-
Notifications
You must be signed in to change notification settings - Fork 3
New issue
Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.
By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.
Already on GitHub? Sign in to your account
COLAB novo #116
Comments
Comment by seocam from Thursday Nov 28, 2013 at 09:37 GMT @morale, as tags são contadas a partir do radical das palavras. Algumas palavras que estão em um stoplist são ignoradas. O valor utilizado no css do tamanho das palavras não é o contador mas sim o peso daquela palavra. Atualmente a função de peso usa log na base 2: int(round(math.log(count, 2))). Indo mais além, para que não tenhamos um cloud apenas com palavras pequenas ou grandes é aplicado um algoritmo de normalização linear para que as tags sempre tenham o peso entre X e Y (sendo X o valor mínimo e Y o máximo). Este foi o algoritmo utilizado:
Sobre clicar em uma palavra chave e mostrar o conteúdo, a gente mostra o conteúdo mais relevante que contém aquela tag. É simples alterar para exibir por por ordem cronológica mas pelo o que vimos o resultado é bem pior. Caso vocês tenham alguma adição para o algoritmo posso atualizar sem problemas. CC: @marciomazza, @Ferri, @jhgouveia PS: A parte mais problemática, e que com certeza precisa de melhorias, é a escolha das tags de acordo com a classe gramatical. Fazer isso em Inglês é infinitamente mais fácil. |
Comment by morale from Tuesday Dec 03, 2013 at 20:01 GMT @seocam , seria possível inserir um critério para reduzir a relevância de uma palavra no conjunto das que surgem na tag - quando tenha sido extraída de texto cujo autor não produziu nada mais no período de 1 ano (último ano)? É um sintoma de que o autor teria se desligado da Comunidade... o q acha? ou seja: considerar o termo sem reduzir a relevância se o autor estiver participando... |
Comment by morale from Tuesday Dec 03, 2013 at 22:38 GMT @Ferri acredito que a importância vai ficando marginal devido a ausência. O tema pode continuar sendo importante mas um ponto de vista emitido a mais de 1 ano tem grande chance de não refletir a realidade atual em razão de mudanças de vários fatores como tecnologia, cenários, etc. |
Comment by jeanferri from Wednesday Dec 04, 2013 at 14:08 GMT @morale ok, concordo, mas é exatamente assim que está implementado hoje. Há um fator de depreciação na relevância onde o tempo faz tudo perder peso. Você deve ter pego algo com uma relevância alta que ainda não depreciou completamente, mas pode ter certeza que está depreciando. Outro fator é que temos o botão curtir, onde cada curtida aumenta o peso de relevância, assim como as visualizações daquele tópico e o número de respostas. Isso tudo é determinado pela comunidade de acordo com suas participações e iterações. |
Issue by morale from Thursday Nov 28, 2013 at 01:18 GMT
Originally opened as TracyWebTech#116
Jean, dei uma olhada nas TAGS e acredito que tenha problemas. Basta fazer algumas consultas para verificar. Está recuperando emails de 5 anos atrás junto com os atuais.... ao clicar numa palavra deveria trazer os assuntos mais recentes relacionados e não mistura-los no tempo. Também, o tamanho das palavras deveria estar relacionado à quantidade encontrada no acervo. Não há proporcionalidade.
att.
The text was updated successfully, but these errors were encountered: