Realizar análisis eficientes utilizando Safecont

-Safecont.com-

Una vez que nos haya llegado la notificación de que el dominio que hemos querido analizar ya haya sido crawleado, podemos comenzar a utilizar el software. En función del tamaño del dominio el análisis computacional puede tarde varios minutos u horas.

Antes de comenzar, algunas definiciones fundamentales para comprender qué aporta Safecont y por qué permite un trabajo enfocado directamente a los problemas de los sitios web. Safecont ofrece:

PandaRisk: Puntuación que Safecont le otorga a un dominio en función del riesgo que corre de ser penalizado algorítmicamente por los motores de búsqueda. La puntuación oscila de 0 %  a 100 %, cuanto más próximo al 100 más posibilidades de penalización. Los valores de peligro bajos aparecerán en color verde, los intermedios en amarillo y naranja y los más peligrosos en rojo. El PandaRisk se calcula a partir de multitud de factores entre los que se encuentran la similitud interna, posibles problemas de thin content, duplicado externo, etc. (se usan muchos más factores correlacionados pero sería complicado mostrarlos todos).

PageRisk: Puntuación que Safecont le otorga a una página/URL dentro del sitio web analizado en función del riesgo que corre de ser penalizada algorítmicamente por los motores de búsqueda. La puntuación oscila de 0 %  a 100 %, cuanto más próximo al 100 más posibilidades de penalización. Los valores de peligro bajos aparecerán en color verde, los intermedios en amarillo y naranja y los más peligrosos en rojo. El PageRisk se calcula a partir de multitud de factores entre los que se encuentran la similitud interna, posibles problemas de thin content, duplicado externo, etc. (se usan muchos más factores correlacionados pero sería complicado mostrarlos todos). En definitiva el PageRisk es una focalización a nivel página de la visión más general que aporta el PandaRisk.

Similarity: Las páginas/URLs de un sitio web pueden tener contenido en común con otras del mismo sitio ya sea contenido duplicado o muy similar (lo que también conlleva alto riesgo). Es decir, el término similaridad es más complejo y va mucho más allá del término habitualmente usado de duplicidad.

PageStrength, LevelStrength y LinkStrength: valoraciones de relevancia a nivel página, nivel de profundidad web o valor de un link equiparables al Pagerank. Se utilizan fundamentalmente a nivel arquitectura web.

Cluster: Agrupación de páginas/URLs en función de determinados patrones que cumplen en común. Se pueden hacer diferentes agrupaciones en función de los problemas detectados que sean recurrentes y peligrosos. Además estos grupos se pueden separar y ordenar por orden de peligrosidad y de esta manera focalizar los posibles problemas del sitio web más fácilmente. Por ejemplo, Safecont muestra el cluster de páginas/URLs más peligrosas dentro del dominio y les otorga un valor de riesgo, por lo que se facilita el trabajo al enfocar qué páginas son peligrosas y por qué para así poder actuar sobre ellas.

Pestañas más relevantes:

HOME: 

La pestaña Home es un compendio a modo resumen de la situación general del dominio y de sus principales problemas. La idea es focalizar y centralizar en una sola pestaña cuáles son los puntos donde primero hay que incidir para trabajar un sitio web. De este modo se puede actuar concisamente y lo que es más importante priorizar sin perder el tiempo.

En la primera pestaña podremos encontrar el número de URLs que se han obtenido con el crawleo del dominio. Este número es solo posible conocerlo con exactitud crawleando el sitio, el resto son estimaciones. Es por ello que hay análisis que pueden llevar más tiempo de esperado aunque no suele suceder.

Vemos también la fecha en la que el análisis fue lanzado. Podemos usar esta fecha para hacer comparativas entre análisis del mismo dominio en diferentes periodos de tiempo.

El rinoceronte incluye el PandaRisk general de dominio. Los colores del mismo se corresponden con los de la barrita lateral, si el color es verde el dominio tiene pocos problemas relacionados con el contenido. El amarillo indica que es posible que haya que tomar determinadas actuaciones para limpiar algunos clusters (agrupaciones de páginas en función de determinados patrones) peligrosos, lo mismo sucede con el color naranja (aunque el esfuerzo de limpieza será mayor) y en el caso del color rojo el peligro del dominio en general es muy alto por lo que las actuaciones han de ser rápidas (de ahí que mostremos datos agrupados para ir directamente a donde están los problemas).

Main problems: Se muestra el número de páginas que tienen problemas de thin content, problemas de similaridad o problemas de contenido duplicado externo. Si hacemos clic en el nombre de cada problema, el enlace nos llevará a la pestaña correspondiente. Es decir, si pinchamos sobre similarity, iremos directamente a la pestaña “similarity” y ahí podremos encontrar los clusters más peligrosos por similaridad y una lista de todas las páginas/URLs del sitio web analizado y que además aparecen por nivel de riesgo de las mismas (para así no perder el tiempo el ver cuáles son las más peligrosas; las más peligrosas son las primeras que aparece).

Gráfico de araña: Enfocando al gráfico podemos visualizar si los parámetros se encuentran de la zona verde que el sitio web a nivel dominio tiene poco peligro de ser penalizado. Si algún punto está fuera, deberemos actuar (habitualmente) sobre aquel tipo de problema en el que la web más despunte. Recordar que hay más factores para calcular el PandaRisk y el PageRisk de los que se muestran en el gráfico pero lo importante es focalizar.

Dangerous clusters: Agrupación de las páginas/URLs que más peligro tienen de ser penalizadas y que por tanto más peligro otorgan a todo el dominio. Se agrupan en tramos de 10 % de peligrosidad y se indica la peligrosidad media del ese cluster (agrupación por patrones comunes de páginas/URLs). Los clusters están ordenados de mayor peligrosidad a menos, por tanto a primera vista en la parte de arriba aparecerán los clusters donde más apremia actuar.

Haciendo clic en los porcentajes, iremos a una página específica de ése cluster donde aparecerán las páginas/URLs que lo componen. Ahí podremos ver cuáles son los principales problemas de cada una y además su puntuación de PageRisk. Es más, podremos seguir haciendo clic en cada URL y ver cuáles son los problemas concretos de la página (por ejemplo, páginas duplicas con ella, thin content ratio, nivel de profundidad, etc.).

Visual dangerous clusters: Esta gráfica acompaña a al listado anterior de dangerous clusters y ordena en barras y colores la peligrosidad y el tamaño (número de páginas/URLs) de cada cluster. Por tanto, una barra verde y muy alargada, indica que un gran número de URLs del sitio web tienen pocos problemas de cara a penalizaciones por contenido.

De un solo vistazo, si encontramos que nuestras gráficas (intentamos usar para clusters siempre las mismas) forman una pirámide con base en la parte izquierda, nuestro dominio está aparentemente a salvo; si forman una pirámide con base en la parte derecha o a partir del medio de la gráfica hacia la derecha, entonces hay mucho trabajo por hacer.

Pinchando en cada barra podemos ver los detalles de la misma e ir al cluster concreto. Siempre lo más recomendable es actuar sobre los valores en rojo (los más peligrosos).

Most dangerous pages: Listado de las páginas más peligrosas del sitio web. Arriba las más peligrosas. Haciendo clic se puede ir al detalle de cada página con multitud de datos para poder trabajar en la solución del problema.

Por tanto, de un vistazo en la pestaña home podemos ver: la peligrosidad del dominio a nivel general, los problemas fundamentales, los clusters o grupos de páginas con más problemas y las páginas/URLs concretas con más problemas. Es decir, visualmente podemos discernir en pocos segundos cómo se encuentra nuestro sitio web y por dónde empezar en caso de necesitar mejoras.


RISK: 

Los círculos muestran los valores medios del dominio en tanto similaridad, contenido duplicado y thin content.

Bajo los valores anteriores aparece un listado completo de páginas/URLs organizadas en función por su nivel de peligrosidad en función de similaridad, contenido duplicado externo o thin content. Las URLs aparecen colocadas por orden, siendo las primeras las que más altos valores tiene de similaridad, etc. Por tanto, es en las primeras URLs por donde hay que empezar a trabajar. Si hacemos clic en las URLs de Similarity, no aparecerá un listado de todas las URLs que tienen similaridad con la URLs en la que hemos clicado y si seguimos clicando en el listado que aparece, podremos ver el detalle de cada URL y si ésta a su vez tiene alta similaridad con otras. Problemas de similaridad conllevan problemas de posible penalización y una baja optimización de los recursos del sitio  tanto a nivel contenido como de arquitectura. Al pinchar en las URLs de contenido duplicado externo, veremos todas las páginas que tienen contenido como el nuestro y su description y title para de esta manera poder focalizar la temática de quien nos replica contenido y poder actuar o no en función de su nicho, etc. La columna de thin content muestra el ratio de thin content de cada página/URL, al hacer clic veremos si la página tiene peligro de ser penalizada (aunque tenga un ratio de thin content alto) y un sinfín de detalles.


CLUSTERS: 

Diferentes tipos de clusters para poder focalizar apropiadamente:

Similarity clusters: Agrupación de páginas con porcentajes de similaridad con otras en rangos parecidos. Por ejemplo, en el rango 80 % – 90 % encontramos páginas con índices de similaridad con otras del 80 % – 90 %.

Al clicar en los porcentajes, veremos un desplegable de las páginas con ésos ratios de similaridad y su PageRisk, así podremos actuar sobre las URLs que más apremian y al hacer de nuevo clic en ellas iremos al detalle de cada una de ellas. Hay que recalcar que las páginas que se encuentran en un mismo cluster no tienen por qué ser similares entre todas ellas pero sí tienen una similaridad al menos de igual valor con otra URL del sitio web analizado.

External duplicate cluster: Agrupación de páginas con porcentajes de duplicidad externa con otras que no pertenecen al dominio analizado. Por ejemplo, en el rango 80 % – 90 % encontramos páginas con valores de duplicado con otras del 80 % – 90 %.

Al clicar en los porcentajes, veremos un desplegable de las páginas con ésos ratios de similaridad, duplicado externo y su PageRisk, así podremos actuar sobre las URLs que más apremian y al hacer de nuevo clic en ellas iremos al listado en el que aparecen todas las URLs con las que hay duplicado externo relevante y sus descripciones y title (para no tener que salir de la plataforma y facilitar el trabajo).

PageRisk clusters: Agrupación de páginas por el índice PageRisk que tienen. En el rango 80 % – 90 % se agrupan aquellas páginas que tienen un PageRisk de 80 % – 90 %. Al hacer clic en los porcentajes, iremos a otra página específica de Safecont donde podremos ver primero los riesgos mayores del cluster en su conjunto y más abajo  las URLs que componen el cluster y sus riesgos particulares (también podemos hacer clic en cada enlace de cada URLs para ir al detalle).


PAGES: 

Podemos ver un listados de ordenado de mayor a menor con aquellas páginas/URLs que tienen un mayor PageRisk, por tanto, las que son más propensas a sufrir caídas de tráfico o penalizaciones primero.

Al hacer clic en cada URL podemos ver los detalles de cada página. Primero a la izquierda un indicador del Pagerisk de la página y a la derecha un aviso del peligro de dicha página.

Más abajo aparecen los detalles generales. Interesantes todos ellos para comparar entre otras páginas cuando hay problemas.

 

Concretamente en el lateral derecho podemos ver “Similar pages with this” donde aparecen el número de páginas (si las hubiese) con contenido similar a la que estamos viendo o contenido duplicado externo (al hacer clic se puede ver el detalle de cada una y abrirlas en el navegador para poder comparar).


ARCHITECTURE: 

Depth levels: De un vistazo podemos ver los niveles de profundidad del sitio web analizado desde la home hasta la última página. Una arquitectura adecuada propicia una distribución adecuada del linkjuice entre niveles y de estos entre páginas. La distribución inadecuada, enlaces que no enlazan donde deberían: páginas con contenido de mala calidad, duplicado, muy similar o pobre, provocan una ineficiencia en el enlazado interno y por tanto un posicionamiento final ineficiente cuando podría ser mucho mejor.

El nivel 1 es la home (se puede clicar en la barra e ir al detalle de la página home). El nivel 2 son las páginas enlazadas directamente desde la home (por ejemplo las categorías en muchos sitios). El resto de profundidades siguen el mismo sistema que el paso del nivel 1 al 2, siendo por ejemplo el tres, el nivel de URLs enlazadas desde el 2 y así sucesivamente. La longitud de las barras indica el número de páginas que componen el nivel y el color si el nivel de LevelStrengt (métrica equivalente al Pagerank del nivel es bueno o malo (suficiente o insuficiente). Todos los niveles deberían aparecer en verde para que el flujo de linkjuice fue correcto y además deberían mantenerse en valores o superiores o próximos a 85.

Un ejemplo de uso, sería ver un nivel en rojo, clicar en él, ver qué páginas lo componen, comprobar de un vistazo cuáles son las más problemáticas y de otro vistazo analizarlas y solventar el problema. Habitualmente los problema son fáciles de resolver pero difíciles de percibir.

Most powerfull pages: Páginas más relevantes, es decir con mas PageStrength (equivalente al PageRank) dentro del sitio analizado. Más arriba las más relevantes. Por tanto, las URLs más importantes para nuestro negocio deberían ser las que aparecieran arriba, en caso de no ser así, la arquitectura del sitio debería variar para que esas URLs alcancen un PageStrength mayor que les ayude a posicionar más fácilmente. Es interesante contrastar el dato de PageStrength con el que aparece a su derecha de nivel de profundidad porque en ocasiones aparecen sorpresas, por ejemplo páginas con PageStrength 100 en nivel de profundidad 4 cuando la media de ese nivel 4 es 0,15.

Common Internal Anchors: Anchor internos (entre páginas de un mismo dominio) más comunes. Se puede ver el anchor text y las veces que se repite. Al hacer clic en el anchor iremos a un listado de todas las URLs donde ése anchor está incluido y el número de veces que aparece ése anchor en esas URLs.  También se da el dato del LinkStrength (equiparable al Pagerank) del enlace que tiene ese anchor text en determinada URL (cosa interesantísima si por ejemplo queremos cambiar anchors para dar más fuerza a determinadas URLs pues sé que links y desde qué URLs son más relevantes).

Esta sección es interesante porque quizá estemos utilizando anchors text recurrentemente que no nos interesen y sin embargo, otros anchors que si nos convendrían para posicionar determinadas partes nuestro sitio, no los estamos utilizando como debiéramos.

Most powerfull Anchors: Anchor texts internos (entre páginas de un mismo dominio) más relevantes. Es decir, aquellos que anchors que tienen un LinkStrength (equiparable al Pagerank) en su conjunto mayor. Al hacer clic, aparecerá una lista por orden de LinkStrenght y las URLs en las que se incluye ése anchor text y las veces que se repite.

Hay que destacar que los anchor texts más comunes no tienen por qué ser los más relevantes.