{"id":6723,"date":"2021-02-11T08:18:47","date_gmt":"2021-02-11T11:18:47","guid":{"rendered":"http:\/\/institutocaptar.com.br\/?p=6723"},"modified":"2023-12-22T14:03:54","modified_gmt":"2023-12-22T17:03:54","slug":"quem-sao-os-cientistas-de-dados","status":"publish","type":"post","link":"http:\/\/institutocaptar.com.br\/index.php\/2021\/02\/11\/quem-sao-os-cientistas-de-dados\/","title":{"rendered":"Quem s\u00e3o os Cientistas de Dados?"},"content":{"rendered":"<p>Os cientistas de dados n\u00e3o s\u00e3o necessariamente respons\u00e1veis diretos por todos os processos envolvidos no ciclo de vida da ci\u00eancia de dados. Por exemplo, os pipelines de dados s\u00e3o, normalmente, de responsabilidade dos engenheiros de dados, mas o cientista de dados pode fazer recomenda\u00e7\u00f5es sobre quais tipos de dados s\u00e3o \u00fateis ou necess\u00e1rios. Como resultado, \u00e9 comum para um cientista de dados fazer parceria com engenheiros de machine learning para escalar modelos de machine learning. A ci\u00eancia de dados \u00e9 o estudo dos dados para extrair insights significativos para os neg\u00f3cios. Ela \u00e9 uma abordagem multidisciplinar que combina princ\u00edpios e pr\u00e1ticas das \u00e1reas de matem\u00e1tica, estat\u00edstica, intelig\u00eancia artificial e engenharia da computa\u00e7\u00e3o para analisar grandes quantidades de dados.<\/p>\n<div style='text-align:center'><iframe width='568' height='316' src='https:\/\/www.youtube.com\/embed\/K3kTld3SZRI' frameborder='0' alt='Quais s\u00e3o as principais fun\u00e7\u00f5es de um cientista de dados?' allowfullscreen><\/iframe><\/div>\n<p>Antes de entendermos o que faz um cientista de dados, \u00e9 necess\u00e1rio compreender primeiro a sua \u00e1rea de atua\u00e7\u00e3o, isto \u00e9, a ci\u00eancia de dados ou data science. Os profissionais de ci\u00eancia de dados usam sistemas de computa\u00e7\u00e3o para acompanhar o processo de ci\u00eancia de dados. Os algoritmos de software e machine learning s\u00e3o usados para obter insights mais profundos, prever resultados e prescrever o melhor plano de a\u00e7\u00e3o.<\/p>\n<h2>Ci\u00eancia de dados na FIA<\/h2>\n<p>N\u00e3o por acaso, os cientistas de dados t\u00eam ocupado espa\u00e7o em organiza\u00e7\u00f5es dos mais diversos segmentos, desde bancos e empresas de pesquisa de mercado at\u00e9 ind\u00fastrias e ag\u00eancias de publicidade. Isso porque o cientista de dados precisa atuar com estrat\u00e9gia para conduzir a empresa no desenvolvimento de neg\u00f3cios, produtos e servi\u00e7os. At\u00e9 \u00e9 poss\u00edvel utilizar algumas ferramentas de an\u00e1lise sem o dom\u00ednio da linguagem de programa\u00e7\u00e3o, entretanto, se voc\u00ea tiver conhecimento, com certeza ser\u00e1 um cientista de dados muito mais completo e com mais oportunidades. O Data mining, ou minera\u00e7\u00e3o de dados, consiste no processo de utilizar a tecnologia para explorar grandes quantidades de dados em busca de padr\u00f5es consistentes.<\/p>\n<p>Agora \u00e9 a vez de examinar os dados antes que eles possam ser tratados com as solu\u00e7\u00f5es em Machine Learning e AI. Dependendo dos requisitos, talvez seja necess\u00e1rio mesclar ou dividir dados de mesma natureza. Se voc\u00ea \u00e9 uma empresa e gostaria de colaborar com o estudo, entre em contato pelo e-mail Se voc\u00ea deseja seguir uma carreira nessa \u00e1rea, prepare-se para receber muitas propostas de emprego. \u00c9 poss\u00edvel ganhar mais que o dobro disso em uma grande empresa em uma metr\u00f3pole, por exemplo.<\/p>\n<h2>Machine learning<\/h2>\n<p>Por exemplo, um vi\u00e9s muito alto indica que o modelo n\u00e3o aprendeu e n\u00e3o consegue, portanto, oferecer uma resposta confi\u00e1vel, o que chamamos de underfitting. Uma vari\u00e2ncia muito alta, por outro lado, indica que o algoritmo est\u00e1 muito adaptado \u00e0queles dados espec\u00edficos e n\u00e3o apresentar\u00e1 uma boa performance caso os dados mudem. Como op\u00e7\u00f5es que voc\u00ea deve conhecer, citamos o Anaconda e as ferramentas de notebook, que preparam toda a estrutura para o desenvolvimento na nuvem. \u00c9 fundamental tamb\u00e9m dominar o github e seus controles de versionamento para organizar a codifica\u00e7\u00e3o e ter uma boa vis\u00e3o na programa\u00e7\u00e3o em grupo. Neste texto, queremos ajudar a esclarecer essas d\u00favidas, dando um panorama da \u00e1rea para que voc\u00ea entenda como come\u00e7ar como cientista de dados.<\/p>\n<p>Nesse sentido, saiba que essa \u00e9 uma \u00e1rea que lida com a captura, armazenamento e processamento de dados e informa\u00e7\u00f5es extra\u00eddos de algum meio a fim de que esses norteiem a tomada de decis\u00f5es mais assertivas em uma empresa. Os pilares <a href=\"https:\/\/www.portalonorte.com.br\/concursos-e-empregos\/por-que-investir-em-um-bootcamp-de-programacao-em-vez-de-cursos\/123213\/\">https:\/\/www.portalonorte.com.br\/concursos-e-empregos\/por-que-investir-em-um-bootcamp-de-programacao-em-vez-de-cursos\/123213\/<\/a> do nosso arsenal incluem o Pandas, onde comandos como&nbsp;read_csv&nbsp;e&nbsp;groupby&nbsp;s\u00e3o fundamentais. NumPy enriquece com efici\u00eancia num\u00e9rica, enquanto o Scikit-learn simplifica o processo de machine learning com&nbsp;fit,&nbsp;transform, e&nbsp;predict.<\/p>\n<h2>Visualiza\u00e7\u00e3o de dados<\/h2>\n<p>Nesse sentido, a pessoa cientista de dados deve entender muito bem o padr\u00e3o SQL e dominar as ferramentas que implementam seus conceitos em Python, como as bibliotecas SQlite e PostGreSQL. \u00c9 importante ter a capacidade de desenvolver modelos para estruturar a  rela\u00e7\u00e3o entre os dados e implement\u00e1-los com uma linguagem. Observando os diferentes tipos de  cientistas de dados, percebemos que a atua\u00e7\u00e3o de profissionais dessa \u00e1rea pode ganhar diversas particularidades, dependendo do contexto. Por isso, tanto para quem se candidata \u00e0s vagas de data scientist quanto para quem contrata, \u00e9 necess\u00e1rio primeiro compreender quais skills s\u00e3o realmente importantes para ocupar determinado posto. O conhecimento desenvolvido sobre Data Science aplicado a aquele modelo de neg\u00f3cio molda profissionais experts em uma vertical.<\/p>\n<ul>\n<li>Ser um cientista de dados significa possuir habilidades avan\u00e7adas de programa\u00e7\u00e3o, essenciais para aplicar conhecimentos na resolu\u00e7\u00e3o de problemas reais.<\/li>\n<li>O curso forma o profissional em apenas 6 meses, com flexibilidade de hor\u00e1rio e local para os estudos e 40% da carga hor\u00e1ria do curso s\u00e3o aulas pr\u00e1ticas.<\/li>\n<li>Mas, para isso, deve apresentar n\u00e3o s\u00f3 conhecimentos t\u00e9cnicos, como algumas soft skills.<\/li>\n<li>Hoje, existe uma ambiguidade que cerca o campo e uma potencial falta de experi\u00eancia profissional nas empresas.<\/li>\n<li>Solu\u00e7\u00f5es de armazenamento em cloud como data lakes oferecem acesso a infraestruturas de armazenamento, capazes de ingerir e processar grandes volumes de dados com facilidade.<\/li>\n<\/ul>\n<p>Ele faz isso conforme as diversas demandas de neg\u00f3cios das empresas para as quais pode trabalhar, usando linguagens de programa\u00e7\u00e3o, como Python, C e R. A partir do que vimos, \u00e9 papel do cientista de dados fazer ci\u00eancia a partir das informa\u00e7\u00f5es coletadas e armazenadas em data lakes. Um cientista de dados precisa saber capturar, armazenar e processar com v\u00e1rias tecnologias. Como vimos, um cientista de dados \u00e9 um profissional estrat\u00e9gico dentro de grandes empresas que aspiram utilizar todos os dados em favor do seu sucesso e crescimento. Por isso mesmo, ter essa vis\u00e3o estrat\u00e9gica e esse conhecimento pode contribuir para otimizar a coleta de dados e o uso deles na gest\u00e3o do devido setor.<\/p>\n<h2>Diferen\u00e7a entre cientista de dados, analista de dados e engenheiro de dados<\/h2>\n<p>Quem se torna cientista de dados entende no seu dia a dia que os modelos perdem qualidade assim que terminam de ser desenvolvidos. Novas caracter\u00edsticas surgem e influenciam o que chamamos de degrada\u00e7\u00e3o do modelo. Para melhorar continuamente e garantir os melhores resultados com os testes e o treinamento, \u00e9 preciso usar as t\u00e9cnicas de MLOps. Outro conhecimento importante para <a href=\"https:\/\/www.portalonorte.com.br\/concursos-e-empregos\/por-que-investir-em-um-bootcamp-de-programacao-em-vez-de-cursos\/123213\/\">Por que investir em um bootcamp de programa\u00e7\u00e3o em vez de cursos tradicionais?<\/a> ter nessa \u00e1rea \u00e9 sobre a infraestrutura dos dados ou a engenharia de dados. Envolve processamento dos dados e importa\u00e7\u00e3o deles para estruturas de armazenamento, com o uso de tecnologias como Hadoop e Spark. Podemos tamb\u00e9m mencionar como fundamentais as habilidades relacionadas \u00e0 infraestrutura de implanta\u00e7\u00e3o e deployment, como o MLOps e as estrat\u00e9gias de pipeline de dados.<\/p>\n<div style='text-align:center'><iframe width='562' height='312' src='https:\/\/www.youtube.com\/embed\/Zwvq-rlIHAw' frameborder='0' alt='Quais s\u00e3o as principais fun\u00e7\u00f5es de um cientista de dados?' allowfullscreen><\/iframe><\/div>\n","protected":false},"excerpt":{"rendered":"<p>Os cientistas de dados n\u00e3o s\u00e3o necessariamente respons\u00e1veis diretos por todos os processos envolvidos no ciclo de vida da ci\u00eancia de dados. Por exemplo, os pipelines de dados s\u00e3o, normalmente, de responsabilidade dos engenheiros de dados, mas o cientista de dados pode fazer recomenda\u00e7\u00f5es sobre quais tipos de dados s\u00e3o [&hellip;]<\/p>\n","protected":false},"author":1,"featured_media":0,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":[],"categories":[31],"tags":[],"_links":{"self":[{"href":"http:\/\/institutocaptar.com.br\/index.php\/wp-json\/wp\/v2\/posts\/6723"}],"collection":[{"href":"http:\/\/institutocaptar.com.br\/index.php\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"http:\/\/institutocaptar.com.br\/index.php\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"http:\/\/institutocaptar.com.br\/index.php\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"http:\/\/institutocaptar.com.br\/index.php\/wp-json\/wp\/v2\/comments?post=6723"}],"version-history":[{"count":1,"href":"http:\/\/institutocaptar.com.br\/index.php\/wp-json\/wp\/v2\/posts\/6723\/revisions"}],"predecessor-version":[{"id":6724,"href":"http:\/\/institutocaptar.com.br\/index.php\/wp-json\/wp\/v2\/posts\/6723\/revisions\/6724"}],"wp:attachment":[{"href":"http:\/\/institutocaptar.com.br\/index.php\/wp-json\/wp\/v2\/media?parent=6723"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"http:\/\/institutocaptar.com.br\/index.php\/wp-json\/wp\/v2\/categories?post=6723"},{"taxonomy":"post_tag","embeddable":true,"href":"http:\/\/institutocaptar.com.br\/index.php\/wp-json\/wp\/v2\/tags?post=6723"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}