Por João Pedro Oliveira (*) 

Estamos a assistir a um momento de transformação digital sem precedentes. A tecnologia e a democratização de dispositivos conectados, geram uma explosão de informação que os Sistemas de Informação tradicionais não estão preparados para lidar.

O paradigma mudou do BI tradicional, onde a maioria dos dados recolhidos são provenientes de fontes operacionais, assentam em dados estruturados e as análises efetuadas com base em informação histórica, para um paradigma de dados massivos analisados em tempo real, provenientes de diversas fontes e com estruturas diversas, estruturadas e não-estruturadas.

Esta realidade abriu o caminho à adoção de novas arquiteturas, ferramentas e metodologias de trabalho.

A estabilidade e maturidade dos Sistemas de Informação foi abalada e desafiada com novos conceitos. Criaram-se condições para a fundação de uma nova arquitetura de referência, preparando as Organizações para uma realidade futura cada vez mais assente no armazenamento e tratamento de informação.

Nasceu o conceito Big Data, usado para classificar informação que agrega três características principais, os chamados três Vs - Volume, Velocidade e Variedade -  e nasceu a peça central que permite lidar com este tipo de informação, o Data Lake.

Parafraseando James Dixon, CTO da Pentaho, se pensarmos que um Data Mart é uma garrafa de água, selecionada e preparada para um fácil consumo, o Data Lake é um corpo massivo de água num estado mais natural, onde a informação flui continuamente de várias fontes e onde é dada a oportunidade aos utilizadores de tirar amostras, experimentar e examinar.

Para explorar a informação no seu estado mais “puro” surgiu a necessidade de encontrar perfis altamente qualificados, com métodos e ferramentas específicas de análise e perfis qualificados no transporte, tratamento e disponibilização da informação. Surgiram deste modo as figuras do Data Scientist e do Data Engineer.

A evolução da capacidade de processamento das infraestruturas, principalmente a nível da velocidade de computação, criou a oportunidade para a adoção e massificação de algoritmos de Inteligência Artificial e Machine Learning. Surgiram novas oportunidades de negócio à volta da utilização da informação e várias indústrias registaram grandes progressos e melhorias de eficiência com a adoção de processos avançados de análise.

Neste contexto, as organizações estão cada vez mais sensibilizadas para a necessidade de apostarem em iniciativas analíticas, principalmente se estiverem alinhadas com melhorias de rentabilidade e eficiência.

A democratização dos dados assume um papel central, bem como a necessidade de apostar na formação e atualização das técnicas e ferramentas das equipas analíticas.

A escassez de perfis qualificados, e as necessidades prementes do mercado, levaram ao movimento de capacitação das equipas de negócio, nascendo o perfil do Citizen Data Scientist.

Este perfil alia um elevado conhecimento do negócio, com a autonomia no uso de técnicas analíticas avançadas.

Com este cenário, torna-se imperativo adquirir, de forma regular, novos conhecimentos neste setor para compreender (ainda melhor) a vantagem competitiva inerente à informação que dispomos no dia a dia. Para todos os profissionais da área, o investimento em formação assume, por isso, um aspeto central, especialmente para progressão da sua carreira, uma vez que poderá traduzir-se na melhoria da sua performance. Importa, por isso, participar em cursos relevantes e é aqui que a WINNING ganha protagonismo, ao disponibilizar formação contínua ao mercado.

No catálogo de formação para 2019, irão ser disponibilizados cursos que abordam todas as vertentes de uma iniciativa de Data Science, desde o tratamento, armazenamento e processamento da informação, com foco nas arquiteturas de Big Data e Cloud, passando pela análise avançada de dados com cursos de Data Mining em R e Python, abordando o tema de automação com métodos de Machine Learning e finalmente disponibilizando cursos não menos importantes na vertente de comunicação de resultados, com a presença de cursos em conhecidas ferramentas de Reporting e Visualização de dados.

Neste âmbito, destaco o curso “Data Science: Ciência dos Dados em R”, a iniciar já no dia 26 de março, dirigida a Analistas, Cientistas de dados, Profissionais de IT, Diretores Funcionais e Executivos e Profissionais de Marketing, IT, Qualidade, Risco, etc.. Esta é uma excelente oportunidade para apostar na formação profissional e obter novas valências analíticas sobre o tratamento de dados.

(*) Head of Data Science Competency Center, WINNING Scientific Management

Newsletter

Receba o melhor do SAPO Tek. Diariamente. No seu email.

Na sua rede favorita

Siga-nos na sua rede favorita.