terça-feira, 19 de dezembro de 2023

BIG DATA É UMA FORMA DE TRABALHAR COM GRANDES CONJUNTOS DE DADOS QUE OS SISTEMA TRADICIONAIS NÃO COMPORTAM

João Vitor de Miranda – Bacharel em Matemática e pós-graduado em Data Science e Analytics

Uma breve introdução sobre o que é Big Data

Com o advento da internet, o volume de dados gerados ao redor do mundo cresceu de forma inesperada conforme os anos foram se passando. A utilização em larga escala de dispositivos móveis ampliou ainda mais a quantidade de dados gerados diariamente.

Os métodos tradicionais para armazenamento e processamento de dados em grandes empresas começaram a não ser suficientes, gerando problemas e gastos cada vez maiores para suprir suas necessidades.

Devido a esses acontecimentos, surgiu o conceito de Big Data, uma área do conhecimento com o intuito de estudar maneiras de tratar, analisar e gerar conhecimento através de grandes conjuntos de dados que não conseguem ser trabalhados em sistemas tradicionais.

Big Data: Conceito

Para entender melhor o que é o Big Data, podemos pensar na forma como esse sistema tradicional de armazenamento e processamento de dados é realizado. Perceba que falamos no presente, porque os processos de trabalho com o Big Data não excluem a forma de trabalhar no sistema tradicional, em grande parte dos casos.

Isso porque muitas empresas não necessitam da utilização de ferramentas do Big Data para manipular os dados, e mesmo as grandes empresas utilizam um sistema híbrido. Dessa forma, as duas maneiras de trabalhar com os dados coexistem.

O sistema tradicional utiliza os famosos SGBDs, ou sistemas gerenciais de banco de dados, que guardam informações de forma estruturada, no formato de tabelas, com linhas e colunas. Utilizam máquinas com grande capacidade de armazenamento e processamento. Quando há a necessidade de expandir a capacidade dessas máquinas, é necessário introduzir novos componentes de hardware, para que tenham mais memória e processamento.

Os problemas que começam a aparecer quando se alcança um grande volume de dados usando esse sistema tradicional são relacionados à escalabilidade, disponibilidade e flexibilidade. Como exemplos, podemos mencionar que é muito custoso o aprimoramento dessas máquinas de maneira vertical a cada vez que é necessário realizar um upgrade, corriqueiramente nesse momento o sistema fica indisponível, já que a máquina está em processo de manutenção.

De forma a compreender a definição de Big Data, é necessário introduzir os conceitos dos V’s do Big Data. Inicialmente, a definição era composta por 3 V’s, mas hoje podemos encontrar definições expandidas com 5, 7 ou mais V’s. Os 7 V’s são: volume, variedade, velocidade, valor, veracidade, variabilidade e visualização.

Mas, vamos concentrar aqui os principais dentre os 7 mencionados anteriormente, conhecidos como os três Vs do big data:

Volume;

Variedade;

Velocidade;

Volume

O volume é a principal característica quando pensamos a respeito de Big Data. Ele diz respeito a uma grande quantidade de dados para serem armazenados e processados, na casa de terabytes, petabytes ou mesmo zettabytes.

Há afirmações de que a quantidade de dados dobra a cada dois anos. Além disso, a quantidade de dados gerada por dia e acumulada ao longo dos anos é tão grande, que não seria interessante a colocação de valores aqui, uma vez que no momento em que você estiver lendo esse artigo esses valores já terão se alterado.

No Worldometers, é possível ter uma ideia da quantidade de dados gerados diariamente e a rapidez com que esses números estão crescendo a cada segundo. Alguns dados impactam bastante por se tratarem de valores em um intervalo de apenas 24 horas.

Já nesse vídeo denominado “Size of internet: bytes perspective”, são comparados os dados com uma escala física, mostrando a diferença entre a quantidade de dados existente na internet em 2001 e 2020.

Variedade

Quais os três tipos de dados em Big Data? Outra característica importante no Big Data é a variedade dos dados que são armazenados e processados. Além dos famosos dados estruturados, o conceito de Big Data trabalha com dados semi-estruturados e não estruturados.

Os dados estruturados são os dados com estrutura rígida em formato tabular, com linhas e colunas.

Os dados semi-estruturados possuem certo tipo de estrutura, mas são mais flexíveis. Os arquivos do tipo XML e JSON são exemplos de dados semi-estruturados.

Já os dados não estruturados são dados sem nenhuma estrutura pré-definida, correspondendo à maior parcela dos dados circulantes no mundo atualmente, em uma proporção bem maior do que os demais tipos. Arquivos de texto, de áudio, vídeo e imagens, são exemplos de dados não estruturados.

Velocidade

A velocidade se refere à rapidez com que os dados são gerados. A todo instante, e-mails, mensagens de texto e áudio são enviados, tweets são publicados, registros em bancos de dados são inseridos e atualizados. Tudo isso em uma escala global.

Não podemos nos esquecer dos dados gerados por máquinas a cada instante, através de sensores e de serviços de streaming que enviam e recebem dados em uma velocidade surpreendente.

A solução encontrada: como o Big Data é aplicado

Para que fosse possível resolver os problemas que surgiram, foi necessário criar novas ferramentas para suprir todas as necessidades. A escalabilidade vertical, no qual aprimoramos uma máquina adicionando mais recursos, como memória e processamento, não garante uma efetividade quando se trata de Big Data.

Para contornar os problemas, grandes empresas pesquisaram um novo sistema que fosse escalável, surgindo então o Hadoop, uma forma de armazenamento e processamento distribuído. A ideia é utilizar cluster de máquinas ou agrupamento de computadores. De forma isolada, um único computador nesse cluster não tem um poder de processamento muito poderoso, mas, em conjunto, conseguem fornecer poder de processamento e armazenamento capazes de suprir as necessidades.

Nesse cluster, existe uma máquina principal conhecida como Name Node que é responsável por gerenciar o restante das outras máquinas, conhecidas como Data Nodes. Os dados possuem réplicas em Data Nodes diferentes para que, caso uma máquina venha a falhar, os dados não serão perdidos e estarão sempre disponíveis. Esse conceito é conhecido em Big Data como disponibilidade.

O mais interessante é que no momento em que necessite ampliar as capacidades, novas máquinas podem ser integradas ao cluster, crescendo de maneira indefinida. Essa é a escalabilidade horizontal, a solução encontrada para os problemas de Big Data.

Comparação entre escalabilidade vertical e escalabilidade horizontal

A partir do surgimento do Hadoop, diversas outras tecnologias foram sendo desenvolvidas em paralelo, criando assim um ecossistema de ferramentas que se expande a cada dia. Dando destaque para a utilização de bancos de dados NoSQL para trabalhar com dados não estruturados.

Ecossistema hadoop com algumas ferramentas

Quais são as 6 fases que compõem o ciclo de vida de um Big Data?

O ciclo de vida em problemas com grandes volumes de dados é um processo que pode ser cíclico. O processo envolve diferentes etapas para gerenciar e extrair valor dos dados. A nomenclatura das fases pode variar, mas, geralmente, são adotadas as etapas de:

Coleta;

Armazenamento;

Processamento;

Análise;

Visualização;

Ação.

Além disso, ao final do processo pode ser necessária a exclusão dos dados com a finalidade de manter questões como a privacidade das informações.

Quais as 4 análises possíveis no Big Data?

O objetivo na coleta e manutenção de uma grande quantidade de dados é a geração de valor. Por isso, são realizadas análises com objetivos específicos.

Análise descritiva: nesse tipo de análise os dados são usados para descrever o que aconteceu no passado. Assim, podem ser identificados padrões, tendências e anomalias nos dados.

Análise diagnóstica: aqui, a análise é usada para entender por que algo aconteceu. Neste caso, estamos interessados em identificar as causas de problemas que já foram notados.

Análise preditiva: na análise preditiva estamos fazendo uma projeção do que irá acontecer no futuro com base em experiências passadas.

Análise prescritiva: nesse caso, o foco é recomendar ações específicas a serem tomadas. Podemos usar os resultados da análise para melhorar a eficiência, a eficácia e a produtividade das empresas.

É importante observar que a escolha do tipo de análise a ser aplicada depende tanto do problema quanto dos dados disponíveis. Diferentes cenários podem exigir mais de um tipo de análise.

O que é preciso para trabalhar com Big Data?

Assim como na Ciência de Dados, são necessárias desde habilidades técnicas até habilidades de comunicação e pensamento crítico. No quesito técnico, as ferramentas de Big Data são muitas e podem deixar dúvidas de por onde a pessoa deve começar a estudar. Confira a seguir, alguns elementos indispensáveis:

O/a profissional terá que aprender pelo menos uma linguagem de programação como Python, R, Java ou Scala. Além disso, terá que estar familiarizado com frameworks como o Apache Hadoop e Spark.

Em se tratando de Bancos de Dados, são necessários conhecimentos tanto de bancos relacionais quanto de NoSQL. Nesse caso, se torna necessário também o conhecimento de sistemas de armazenamento distribuído.

O Hadoop é um dos principais frameworks para processamento de Big Data. Assim, torna-se vantajoso conhecer o ecossistema do Hadoop com as ferramentas MapReduce, Hive, Pig e HBase.

Por outro lado, existem diversas plataformas na nuvem como o Google Cloud, Azure e AWS que tendem a facilitar esse processo, além de permitir o armazenamento e processamento veloz de grandes volumes de dados. A plataforma DataBricks abstrai muito do trabalho com Big Data e com as plataformas de nuvem, sendo um ótimo caminho para um primeiro contato de quem está iniciando no Big Data e já conhece alguma das linguagens de programação citadas.

Qual o grande desafio do Big Data?

O Big Data apresenta diversos desafios, mas o maior deles está relacionado ao gerenciamento do problema. Além disso, o processamento e análise de grandes volumes de dados faz com que seja necessário escolher plataformas ideais. Só assim, é possível assegurar questões como a escalabilidade e integração de informações.

O custo e infraestrutura devem ser bem analisados, pois lidar com Big Data pode ser caro, tanto em termos de infraestrutura quanto de recursos humanos. Investir em tecnologias avançadas e profissionais qualificados também é necessário para obter sucesso nessa área.

Superar esses desafios exige uma combinação de habilidades técnicas e abordagens inovadoras. Além disso, as soluções para esses desafios continuam a evoluir à medida que a tecnologia e as práticas relacionadas ao Big Data avançam.

Como aplicar o Big Data na sua empresa?

O processo de aplicação do Big Data pode variar de caso a caso. Isso porque ele envolve um processo cuidadoso e estratégico para aproveitar o potencial dos dados para impulsionar a tomada de decisões e otimizar processos. Confira abaixo algumas etapas importantes para a aplicação do Big Data na sua empresa:

De forma geral, no primeiro passo devemos definir objetivos e metas. Isso envolve identificar se o objetivo final envolve melhorar a eficiência operacional, aumentar a satisfação dos clientes ou mesmo se o foco será desenvolver produtos ou serviços mais personalizados.

Posteriormente, deve ser avaliada a infraestrutura existente, se a empresa possui um banco de dados local ou na nuvem. Além disso, é necessário avaliar se a capacidade computacional disponível irá comportar o processamento dos dados. Na análise dos dados o processamento envolve muito mais do que o exigido por simples requisições a um banco de dados.

Após a avaliação da capacidade de infraestrutura deve-se criar uma estratégia de dados. Verificar se a empresa já possui os dados necessários ou se será necessário adquirir informações para a solução do problema proposto. Com a conclusão dessa etapa já é possível aplicar as análises adequadas.

Durante todo o processo é necessário garantir a segurança e privacidade dos dados. 

Além disso, em problemas de Big Data os dados não costumam ser estáticos, eles mudam com o tempo. Imagine que os seus dados envolvam a interação de clientes com uma plataforma de vendas. Os clientes irão continuar interagindo mesmo depois da data que os dados foram coletados. Por isso, é necessário monitorar e iterar sobre o mesmo problema conforme necessário.

Conclusão

Diante de tudo que foi apresentado, foi possível compreender a importância e os conceitos iniciais, além da definição de Big Data. As soluções e ferramentas criadas foram essenciais para que o mundo atual esteja em constante evolução. Por se tratar de uma área muito ampla, muitos conceitos ficaram de fora desse artigo. Caso queira expandir ainda mais os conhecimentos, a internet tem um volume muito grande de conteúdos, você pode encontrá-los em uma variedade de formatos e você vai encontrar em uma velocidade muito rápida.

ESCALANDO NEGÓCIOS DA VALEON

1 – Qual é o seu mercado? Qual é o tamanho dele?

O nosso mercado será atingir os 766 mil habitantes do Vale do Aço e poder divulgar os produtos / serviços para vocês clientes, lojistas, prestadores de serviços e profissionais autônomos e obter dos consumidores e usuários a sua audiência.

A ValeOn atenderá a todos os nichos de mercado da região e especialmente aos pequenos e microempresários da região que não conseguem entrar no comércio eletrônico para usufruir dos benefícios que ele proporciona. Pretendemos cadastrar todas as empresas locais com CNPJ ou não e coloca-las na internet.

2 – Qual problema a sua empresa está tentando resolver? O mercado já expressou a necessidade dessa solução?

A nossa Plataforma de Compras e Vendas que ora disponibilizamos para utilização das Empresas, Prestadores de Serviços e Profissionais Autônomos e para a audiência é um produto inovador sem concorrentes na região e foi projetada para atender às necessidades locais e oferecemos condições de adesão muito mais em conta que qualquer outro meio de comunicação.

Viemos para suprir as demandas da região no que tange a divulgação de produtos/serviços cuja finalidade é a prestação de serviços diferenciados para a conquista cada vez maior de mais clientes e públicos.

O nosso diferencial está focado nas empresas da região ao resolvermos a dor da falta de comunicação entre as empresas e seus clientes. Essa dor é resolvida através de uma tecnologia eficiente que permite que cada empresa / serviços tenha o seu próprio site e possa expor os seus produtos e promoções para os seus clientes / usuários ao utilizar a plataforma da ValeOn.

3 – Quais métodos você usará para o crescimento? O seu mercado está propício para esse tipo de crescimento?

Estratégias para o crescimento da nossa empresa

  1. Investimento na satisfação do cliente. Fidelizar é mais barato do que atrair novos clientes.
  2. Equilíbrio financeiro e rentabilidade. Capital de giro, controle de fluxo de caixa e análises de rentabilidade são termos que devem fazer parte da rotina de uma empresa que tenha o objetivo de crescer.
  3. Desenvolvimento de um planejamento estratégico. Planejar-se estrategicamente é como definir com antecedência um roteiro de viagem ao destino final.
  4. Investimento em marketing. Sem marketing, nem gigantes como a Coca-Cola sobreviveriam em um mercado feroz e competitivo ao extremo.
  5. Recrutamento e gestão de pessoas. Pessoas são sempre o maior patrimônio de uma empresa.

O mercado é um ambiente altamente volátil e competitivo. Para conquistar o sucesso, os gestores precisam estar conectados às demandas de consumo e preparados para respondê-las com eficiência.

Para isso, é essencial que os líderes procurem conhecer (e entender) as preferências do cliente e as tendências em vigor. Em um cenário em que tudo muda o tempo todo, ignorar as movimentações externas é um equívoco geralmente fatal.

Planeje-se, portanto, para reservar um tempo dedicado ao estudo do consumidor e (por que não?) da concorrência. Ao observar as melhores práticas e conhecer quais têm sido os retornos, assim podemos identificar oportunidades para melhorar nossa operação e, assim, desenvolver a bossa empresa.

4 – Quem são seus principais concorrentes e há quanto tempo eles estão no mercado? Quão grandes eles são comparados à sua empresa? Descreva suas marcas.

Nossos concorrentes indiretos costumam ser sites da área, sites de diretório e sites de mídia social. Nós não estamos apenas competindo com outras marcas – estamos competindo com todos os sites que desejam nos desconectar do nosso potencial comprador.

Nosso concorrente maior ainda é a comunicação offline que é formada por meios de comunicação de massa como rádios, propagandas de TV, revistas, outdoors, panfletos e outras mídias impressas e estão no mercado há muito tempo, bem antes da nossa Startup Valeon.

5 – Sua empresa está bem estabelecida? Quais práticas e procedimentos são considerados parte da identidade do setor?

A nossa empresa Startup Valeon é bem estabelecida e concentramos em objetivos financeiros e comerciais de curto prazo, desconsideramos a concorrência recém chegada no mercado até que deixem de ser calouros, e ignoramos as pequenas tendências de mercado até que representem mudanças catastróficas.

“Empresas bem estabelecidas igual à Startp Valeon devemos começar a pensar como disruptores”, diz Paul Earle, professor leitor adjunto de inovação e empreendedorismo na Kellogg School. “Não é uma escolha. Toda a nossa existência está em risco”.

6 – Se você quiser superar seus concorrentes, será necessário escalar o seu negócio?

A escalabilidade é um conceito administrativo usado para identificar as oportunidades de que um negócio aumente o faturamento, sem que precise alavancar seus custos operacionais em igual medida. Ou seja: a arte de fazer mais, com menos!

Então, podemos resumir que um empreendimento escalável é aquele que consegue aumentar sua produtividade, alcance e receita sem aumentar os gastos. Na maioria dos casos, a escalabilidade é atingida por conta de boas redes de relacionamento e decisões gerenciais bem acertadas.

Além disso, vale lembrar que um negócio escalável também passa por uma fase de otimização, que é o conceito focado em enxugar o funcionamento de uma empresa, examinando gastos, cortando desperdícios e eliminando a ociosidade.

Sendo assim, a otimização acaba sendo uma etapa inevitável até a conquista da escalabilidade. Afinal de contas, é disso que se trata esse conceito: atingir o máximo de eficiência, aumentando clientes, vendas, projetos e afins, sem expandir os gastos da operação de maneira expressiva.

Pretendemos escalar o nosso negócio que é o site marketplace da Startup Valeon da seguinte forma:

  • objetivo final em alguma métrica clara, como crescimento percentual em vendas, projetos, clientes e afins;
  • etapas e práticas que serão tomadas ao longo do ano para alcançar a meta;
  • decisões acertadas na contratação de novos colaboradores;
  • gerenciamento de recursos focado em otimização.

 

Nenhum comentário:

Postar um comentário

ORAÇÃO PROFÉTICA DE UM PASTOR DOS EUA

  Brasil e Mundo ...