No es novedad que el contenido de la web no sea del todo original y muchas web tengan contenido duplicado de otras, pero les comento que los ingenieros de Google tienen un canal en YouTube llamado GoogleWebmasterHelp, este canal lo utilizan para responder las consultas hechas por los webmasters, y recientemente el ingeniero Matt Cutts reveló que prácticamente casi uno que pueden leer en el título.
Sucede que un tercio de la web es contenido duplicado. ¿Por qué un tercio de la web tiene contenido duplicado? Es porque cuando se publica una nota en determinado sitio, el contenido duplicado se da de inmediato en distintos sitios de Internet. La empresa de Mountain View tiene el trabajo de revisar todas las notas replicadas y solo se encarga de destacar algunas entre sus resultados.
Según el ingeniero Cutts, entre el 25% y el 30% del contenido de la web es duplicado, por lo tanto, el algoritmo de Google tiene la función de agrupar todo el contenido en un paquete, dentro de este paquete solo se destaca el contenido más importante. No es un problema para Google, si existen varios artículos iguales Google no los indexará de forma independiente, escogerá el mejor para ponerlo en una buena posición.
Fuente: Search Engine Roundtable