Data Mining (DM)
Posted: Wed Aug 07, 2013 1:09 am
Data Mining (DM)-III, August 13 2012
Postby ROCKStormSJ4315 on Tue Apr 03, 2012 12:18 am
La minería de datos, no es otra cosa que extraer datos, de alguna fuente, con el objetivo de ser analizada y obtener de esa fuente información, que hasta ese momento podría no haber sido descubierta. La misma podría ser útil para hallazgos importantes, provocar análisis más profundo, ayudar en apoyo de teorías, etc. Algunos le llaman extracción de conocimiento. En fin, es un archivo de datos, de donde cualquier persona que le guste el análisis matemático, podría descubrir muchas cosas que no han sido conocidas, porque nadie se había tomado la molestia de usar los datos para un objetivo en particular. Como parte de un proyecto en mis estudios, de tema libre, pero haciendo uso de este concepto, estoy trabajando en el particular. Obviamente uno de los temas que seleccione fue el estado del tiempo en Puerto Rico. Lo que tengo hasta ahora es muy preliminar, pero ya esta pesca de datos me ha servido para descubrir aspectos interesantes de nuestro clima. Como es un proceso que toma su tiempo y el análisis de datos es un tanto complejo (estadístico), trataré de colocar alguno de los resultados una vez estén disponibles. El objetivo no es meteorológico, es meramente hacer uso del DM y el material aprendido en clase. Tampoco pretende explicar con lujo de detalle las posibles causas de los hallazgos. Es revelar resultados que sirven para otras personas llegar a sus propias conclusiones o el inicio de investigaciones más profundas. En otras palabras concienciar en un área que poco a poco está adquiriendo importancia mayormente en el sector económico. Por lo limitado del portal, para publicar graficas, lo árido de algunas pruebas y que el estudio surge de un curso no relacionado al foro, no sé que pueda descubrir y tengo el tiempo en contra; sólo escribiré aquí algunos de los resultados si son reveladores. Los demás, de ser relevantes (De nuevo, aún no se que descubra, si algo), para la próxima reunión con los amigos del foro, que me imagino que es pronto.
Last edited by ROCKStormSJ4315 on Mon Aug 13, 2012 11:13 pm, edited 2 times in total.
God is great, beer is good and this season looks crazy B. C.
User avatar
ROCKStormSJ4315 Categoria 5++
Categoria 5++ Posts: 2831Joined: Wed Sep 15, 2010 12:54 pmLocation: Hato Rey, San Juan, PR
Top
--------------------------------------------------------------------------------
Re: Minería de datos- Data Mining (DM)
Postby ROCKStormSJ4315 on Mon Apr 30, 2012 4:26 am
Bueno, ya la primera fase del estudio fue completado. Como sintesis puedo indicar que del estudio se reflejo, que ni la temperatura maxima de invierno ni la minima, se comportaron de acuerdo a una distribucion normal estadistica. Que esto debe ocurrir en meteorologia no se. En DM solo se extraen datos y se analizan. Las conclusiones estan abiertas a todo tipo. Curiosamente, donde se experimentan mas bajas temoeraturas que lo normal es en la minimas. Yo opinaba eso mismo pero a la inversa. Las maximas no estuvieron tan distantes de lo que es lo razonable. No se desprende del estudio que estuvieron debajo del promedio. El mes mas cerca de lo normal fue marzo con las temperaturas maximas, pero en cierta medida "skewed to the righ tail". En temperaturas minimas el mas normal fue febrero aunque es un "flat distribution". El mes mas atipico en temperaturas minimas fue enero. El mas atipico en temperaturas maximas febrero. El mas normal para las maximas, ninguno. Curiosamente fue el mes de marzo el que reflejo una tendenca de temperaturas minimas bajo lo normal. Las maximas por lo general por encima del promedio.
Last edited by ROCKStormSJ4315 on Tue May 29, 2012 12:42 am, edited 1 time in total.
God is great, beer is good and this season looks crazy B. C.
User avatar
ROCKStormSJ4315 Categoria 5++
Categoria 5++ Posts: 2831Joined: Wed Sep 15, 2010 12:54 pmLocation: Hato Rey, San Juan, PR
Top
--------------------------------------------------------------------------------
Re: Minería de datos- Data Mining (DM)
Postby ROCKStormSJ4315 on Tue May 01, 2012 2:58 am
En la segunda parte del estudio que hice, se busco si habia algun tipo de interaccion y de que magnitud, entre 9 variables de nuestra climatologia y las temperaturas. Los resultados fueron sorprendentes. No se encontro relacion significativa(ja el famoso p-value de estadisticas) con ninguna de ellas. Variables que uno sabe que deben tener algun tipo de correlacion. No paso del 30 % y menor cuando se busco correlacionarlo con las temperaturas minimas. Me parecio entender que la companera Ada Monzon esta recopilando informacion sobre las temperaturas tambien. Si algun amigo forista conoce mas informacion sobre esto, envienme un e-mail. Podriamos estar trabajando en lo mismo. Yo no puedo entrar a la pagina del tiempo de Univision, porque esta en Facebook. Yo aun no he caido en la tentacion de las redes sociales. Solo en esta. Tengo o tenia como 5 cuentas de Facebook, que me han abierto familiares y amistades en el pasado y ni eso me motivo ni siquiera a entrar una primera vez. Asi que como no tengo detalles alguien que sepa, nuevamente, me deja saber.
Con dos semanas de trabajo, usando el DM hice un paper de 40 paginas y eso no es ni un 10% de lo que se puede hacer con el "data base" que esta disponible. De las dos partes del trabajo, se por que los resultados estadisticos reflejaton lo que tengo en el informe. Por aqui es casi imposible, como dije antes poner algo mas detallado, pues colocar tablas y graficas aqui es mas dificil que ir de San Juan a Cataño por el famoso puente que se supone ya este construido
Quizas en una futura reuion del foro. Como en los viejos tiempos de la Sociedad Ciclonologica que en las actividades, siempre habia un orador.
Postby ROCKStormSJ4315 on Tue Apr 03, 2012 12:18 am
La minería de datos, no es otra cosa que extraer datos, de alguna fuente, con el objetivo de ser analizada y obtener de esa fuente información, que hasta ese momento podría no haber sido descubierta. La misma podría ser útil para hallazgos importantes, provocar análisis más profundo, ayudar en apoyo de teorías, etc. Algunos le llaman extracción de conocimiento. En fin, es un archivo de datos, de donde cualquier persona que le guste el análisis matemático, podría descubrir muchas cosas que no han sido conocidas, porque nadie se había tomado la molestia de usar los datos para un objetivo en particular. Como parte de un proyecto en mis estudios, de tema libre, pero haciendo uso de este concepto, estoy trabajando en el particular. Obviamente uno de los temas que seleccione fue el estado del tiempo en Puerto Rico. Lo que tengo hasta ahora es muy preliminar, pero ya esta pesca de datos me ha servido para descubrir aspectos interesantes de nuestro clima. Como es un proceso que toma su tiempo y el análisis de datos es un tanto complejo (estadístico), trataré de colocar alguno de los resultados una vez estén disponibles. El objetivo no es meteorológico, es meramente hacer uso del DM y el material aprendido en clase. Tampoco pretende explicar con lujo de detalle las posibles causas de los hallazgos. Es revelar resultados que sirven para otras personas llegar a sus propias conclusiones o el inicio de investigaciones más profundas. En otras palabras concienciar en un área que poco a poco está adquiriendo importancia mayormente en el sector económico. Por lo limitado del portal, para publicar graficas, lo árido de algunas pruebas y que el estudio surge de un curso no relacionado al foro, no sé que pueda descubrir y tengo el tiempo en contra; sólo escribiré aquí algunos de los resultados si son reveladores. Los demás, de ser relevantes (De nuevo, aún no se que descubra, si algo), para la próxima reunión con los amigos del foro, que me imagino que es pronto.
Last edited by ROCKStormSJ4315 on Mon Aug 13, 2012 11:13 pm, edited 2 times in total.
God is great, beer is good and this season looks crazy B. C.
User avatar
ROCKStormSJ4315 Categoria 5++
Categoria 5++ Posts: 2831Joined: Wed Sep 15, 2010 12:54 pmLocation: Hato Rey, San Juan, PR
Top
--------------------------------------------------------------------------------
Re: Minería de datos- Data Mining (DM)
Postby ROCKStormSJ4315 on Mon Apr 30, 2012 4:26 am
Bueno, ya la primera fase del estudio fue completado. Como sintesis puedo indicar que del estudio se reflejo, que ni la temperatura maxima de invierno ni la minima, se comportaron de acuerdo a una distribucion normal estadistica. Que esto debe ocurrir en meteorologia no se. En DM solo se extraen datos y se analizan. Las conclusiones estan abiertas a todo tipo. Curiosamente, donde se experimentan mas bajas temoeraturas que lo normal es en la minimas. Yo opinaba eso mismo pero a la inversa. Las maximas no estuvieron tan distantes de lo que es lo razonable. No se desprende del estudio que estuvieron debajo del promedio. El mes mas cerca de lo normal fue marzo con las temperaturas maximas, pero en cierta medida "skewed to the righ tail". En temperaturas minimas el mas normal fue febrero aunque es un "flat distribution". El mes mas atipico en temperaturas minimas fue enero. El mas atipico en temperaturas maximas febrero. El mas normal para las maximas, ninguno. Curiosamente fue el mes de marzo el que reflejo una tendenca de temperaturas minimas bajo lo normal. Las maximas por lo general por encima del promedio.
Last edited by ROCKStormSJ4315 on Tue May 29, 2012 12:42 am, edited 1 time in total.
God is great, beer is good and this season looks crazy B. C.
User avatar
ROCKStormSJ4315 Categoria 5++
Categoria 5++ Posts: 2831Joined: Wed Sep 15, 2010 12:54 pmLocation: Hato Rey, San Juan, PR
Top
--------------------------------------------------------------------------------
Re: Minería de datos- Data Mining (DM)
Postby ROCKStormSJ4315 on Tue May 01, 2012 2:58 am
En la segunda parte del estudio que hice, se busco si habia algun tipo de interaccion y de que magnitud, entre 9 variables de nuestra climatologia y las temperaturas. Los resultados fueron sorprendentes. No se encontro relacion significativa(ja el famoso p-value de estadisticas) con ninguna de ellas. Variables que uno sabe que deben tener algun tipo de correlacion. No paso del 30 % y menor cuando se busco correlacionarlo con las temperaturas minimas. Me parecio entender que la companera Ada Monzon esta recopilando informacion sobre las temperaturas tambien. Si algun amigo forista conoce mas informacion sobre esto, envienme un e-mail. Podriamos estar trabajando en lo mismo. Yo no puedo entrar a la pagina del tiempo de Univision, porque esta en Facebook. Yo aun no he caido en la tentacion de las redes sociales. Solo en esta. Tengo o tenia como 5 cuentas de Facebook, que me han abierto familiares y amistades en el pasado y ni eso me motivo ni siquiera a entrar una primera vez. Asi que como no tengo detalles alguien que sepa, nuevamente, me deja saber.
Con dos semanas de trabajo, usando el DM hice un paper de 40 paginas y eso no es ni un 10% de lo que se puede hacer con el "data base" que esta disponible. De las dos partes del trabajo, se por que los resultados estadisticos reflejaton lo que tengo en el informe. Por aqui es casi imposible, como dije antes poner algo mas detallado, pues colocar tablas y graficas aqui es mas dificil que ir de San Juan a Cataño por el famoso puente que se supone ya este construido
Quizas en una futura reuion del foro. Como en los viejos tiempos de la Sociedad Ciclonologica que en las actividades, siempre habia un orador.