Oracle lista sua visão sobre o futuro do Big Data

   

     Empresas de diversos portes estão descobrindo novas maneiras de coletar e usar mais dados e, em 2016, os esforços para tornar o Big Data mais popular serão cada vez mais intensos.

Agora que as organizações já têm mais conhecimento do que é o Big Data, as questões chave mudaram para quais são as estratégias e as habilidades necessárias e como é possível medir o ROI.

Como de praxe, um dos principais desafios envolvendo projetos de Big Data continuará sendo transformar dados de múltiplas fontes em informações úteis. Definir as melhores estratégias de Dig Data para alavancar os negócios e como as companhias poderão dar inteligência aos dados para acelerar a tomada de decisão.

Pensando nisso, a Oracle elencou dez tendências para o uso de Big Data nas empresas.

1. Usuários de áreas de negócio, fora da TI, trabalharão cada vez mais como cientistas de dados. Embora as estatísticas complexas ainda estejam limitadas aos cientistas de dados, as tomadas de decisão orientadas por dados não precisam vir exclusivamente destes especialistas. Em 2016, ferramentas mais simples para a descoberta de Big Data permitirão que os analistas empresariais adquiram conjuntos de dados nos clusters empresariais Hadoop, os redefinam em novas combinações e até os analisem com técnicas exploratórias de aprendizado de máquinas. Ampliar este tipo de exploração para uma audiência ainda maior incentivará o acesso ao autosserviço para big data com mais experimentos a fim de incentivar a inovação.

2. Laboratórios experimentais de dados se tornarão uma prática. Com mais oportunidades para investigar, empresas consolidadas no mercado aumentarão a demanda por cientistas de dados. Bancos, seguradoras e empresas de classificação de crédito, por exemplo, usarão algoritmos para avaliar o risco e elevar a proteção de forma mais eficiente contra fraudes. No entanto, obter regras claras será um desafio para a maioria dessas decisões. É esperado o aumento dos experimentos de risco padrão, política de subscrição e detecção de fraude à medida que as empresas identificam hotspots para obter vantagem dos algoritmos mais rápido do que a concorrência.

3. O 'faça você mesmo' dará lugar a soluções. Os primeiros adeptos do big data não tinham outra opção a não ser criarem seus próprios clusters e ambientes de trabalho. Mas desenvolver, gerenciar e fazer a manutenção desses sistemas únicos criados em Hadoop, Spark e outras tecnologias emergentes custa caro e consome tempo. De fato, o tempo médio de desenvolvimento é de seis meses. Quem pode esperar tanto tempo? Em 2016, veremos as tecnologias amadurecerem e se tornarem mais comerciais graças aos serviços e aplicativos em nuvem com automação e padronização pré-configuradas.

4. A virtualização de dados se tornará uma realidade. As empresas não só coletam uma grande variedade de dados, bem como usam uma grande variedade de algoritmos, análises e aplicativos. Mas os desenvolvedores e analistas não deveriam ser obrigados a saber onde estão os dados, ou ficarem ligados somente aos métodos de acesso apoiados pelo local de armazenamento. Haverá uma mudança de foco no uso de qualquer tecnologia isolada, como NoSQL, Hadoop, relacional, espacial ou gráfica, para aumentar a confiança na virtualização de dados. Usuários e aplicativos se conectam a dados virtualizados, via SQL, REST e linguagens de script. A tecnologia de virtualização de dados bem-sucedida oferecerá desempenho igual ao de métodos nativos, com compatibilidade e segurança completas para versões anteriores.

5. A programação de fluxo de dados abrirá as comportas. As primeiras ondas da adoção de big data focavam no processamento de dados codificados manualmente. Novas ferramentas de gerenciamento irão separar e isolar as tecnologias de big data das necessidades de processamento de dados de maior complexidade. Também veremos o surgimento de programação de fluxos de dados que se aproveitam do paralelismo extremo, reutilização simplificada de operadores funcionais, e dão suporte conectável para funções de aprendizado de estatísticas e de máquina.

6. A Inteligência artificial como grande aliada. 2016 será o ano em que as tecnologias de Inteligência Artificial, como Aprendizado de Máquinas (ML), Processamento de Linguagem Natural (NLP) e Gráficos de Propriedade (PG, siglas em inglês), serão aplicadas a desafios comuns de processamento de dados. Embora ML, NLP e PG já fossem acessíveis como APIs de Big Data, a nova mudança incluirá usos mais amplos dessas tecnologias em ferramentas de TI que suportem aplicativos, análises em tempo real e ciência de dados.

7. Repositórios vão explorar a origem para esclarecer dados. Quando os dados dos painéis corporativos vinham de armazenamentos confiáveis, o conhecimento sobre sua linhagem era prescindível. Mas na era do big data, a linhagem dos dados é fundamental, pois as empresas estão mesclando informações com conjuntos de dados de terceiros. Algumas dessas novas combinações irão incorporar dados de alta qualidade verificados pelo fornecedor. Mas outras usarão dados que não são oficialmente perfeitos, mas bons o bastante para desenvolver protótipos. Quando descobertas valiosas surgirem dessas explorações, os gerentes olharão para a linhagem a fim de saber quanto trabalho é necessário para elevá-las aos níveis de qualidade de produção.

8. Internet das Coisas + Nuvem = aplicativos revolucionários de Big Data. Os serviços de Big Data em nuvem são a mágica nos bastidores da Internet das Coisas (IoT). A ampliação dos serviços em nuvem não coletará apenas dados de sensores, mas também alimentará análises de big data e algoritmos a fim usá-los. Os serviços altamente seguros na nuvem IoT também ajudarão os fabricantes a criarem novos produtos que atuem com segurança nos dados analisados sem intervenção humana.

9. Políticas de dados impulsionarão a nuvem híbrida. Saber a procedência dos dados - não só de qual sensor ou sistema, mas também do território de qual país - facilitará que governos reforcem suas políticas nacionais de dados. Corporações multinacionais mudando para a nuvem serão pegas entre interesses concorrentes. Cada vez mais, as empresas globais optarão por nuvem híbridas com máquinas em data centers regionais que atuam como uma dependência local de um serviço em nuvem global, assegurando a busca pela redução de custo e a compatibilidade regulatória.

10. Novos sistemas de classificação de segurança vão equilibrar proteção e acesso. O aumento do conhecimento do consumidor sobre as formas como os dados são coletados, compartilhados e armazenados - e roubados - amplificará os pedidos por proteções regulatórias para as informações pessoais. Espere ver políticos, acadêmicos e colunistas discutindo limites e ética. As empresas aumentarão o uso de sistemas de classificação que organizam os documentos e dados em grupos com políticas pré-definidas para acesso, redação e ocultamento. A ameaça contínua de hackers cada vez mais sofisticados encorajará as empresas a aumentarem a segurança, bem como o acesso de auditoria e o uso de dados.