Inteligência Artificial e Data Science sem mistério


14/08/2019

Recomende The Shift

Você venderia seus dados pessoais?

A confiança é o calcanhar de Aquiles da Inteligência Artificial nas pesquisas médicas. E na opinião do oftalmologista e pesquisador de Stanford, Robert Chang, ela precisa ser conquistada já no início do processo, durante a obtenção dos dados para treinamento.

Depois de muito implorar pela doação de dados de exames de seus pacientes e recorrer a dados de colaboradores de outras universidades, ele decidiu criar um sistema para incentivar os pacientes a compartilhar seus dados com pesquisadores de IA, de forma anônima, e ainda serem remunerados quando os dados fornecidos forem usados.

"Podemos ajudar as pessoas a manter o controle de seus dados e, ao mesmo tempo, permitir que eles sejam utilizados de maneira a preservar a privacidade em modelos de aprendizado de máquina", diz Dawn Song, professora da Universidade da Califórnia-Berkeley, parceira de Chang na criação do sistema Kara. Na opinião de Song, a IA aplicada à saúde é uma boa maneira de começar a testar a propriedade e venda de dados pessoais, em parte porque as pessoas já são pagas para participar de estudos clínicos.

O Kara usa uma técnica conhecida como privacidade diferencial, que limita a visibilidade de partes do sistema para todas as partes envolvidas. Os pacientes enviam fotos de seus dados médicos - digamos, um exame de olhos - e os pesquisadores médicos, como Chang, alimentam os sistemas de IA que precisam de dados para treinar. Tudo isso é armazenado na plataforma baseada no blockchain do Oasis Labs, que criptografa e anonimiza os dados.

Como todos os cálculos acontecem dentro dessa caixa preta, os pesquisadores nunca veem os dados que estão usando. Isso leva a dois problemas a serem superados no caminho: a qualidade dos dados usados para treinamento e as restrições que os usuários podem definir para o uso dos dados cedidos.

Para quem quer se aprofundar no tema:

  • Quanto podem valer seus dados pessoais? Segundo o artigo especial Tomorrow's Data Heroes, produzido pela Strategy&Business, em 2025, o valor total dos dados produzidos globalmente pode chegar a mais de US$ 400 bilhões, e se os usuários de internet resolverem monetizar dados pessoais, podem gerar em média US$ 2,36 por pessoa. O valor nos EUA seria maior, de US$ 9,82 por pessoa.
     
  • O governador da Califórnia, Gavin Newson, disse recentemente que os “consumidores californianos deveriam poder compartilhar da riqueza que é gerada a partir de seus dados”,  ao defender a “California Consumer Privacy Act”, lei que entrará em vigor em janeiro de 2020 e que possibilitará que consumidores no estado vendam seus dados pessoais para empresas que queiram ou precisem utilizá-los.
     
  • A Califórnia também será o primeiro estado americano a proibir a venda de kits CRISPR do tipo "faça você mesmo", a menos que eles tenham um aviso em negrito declarando não serem destinados para autoadministração.
     
  • Crescem nos EUA as dúvidas quanto às práticas de privacidade e proteção de dados pessoais das empresas que oferecem os chamados testes genéticos direct-to-consumer (DTC). Apesar do Genetic Information Nondiscrimination Act (GINA), vigorar desde 2008, para impedir que empregadores e seguradoras de saúde usem informações genéticas para tomar decisões sobre contratar, demitir ou aumentar o valor cobrado, e das tentativas do estabelecimento de boas práticas entre as empresas de DTC,  os americanos já reivindicam uma proteção maior para sua a privacidade genômica.

O "caso de amor" de Wall Street com a IA

Primeiro foi só um flerte, mas agora o ecossistema do mercado de capitais está mudando seu status para "relacionamento sério" com Inteligência Artificial, Big Data e Analytics. Um relatório produzido este ano pela empresa londrina TABB Group, chamado Big Data, AI and Machine Learning Adoption: Where Are We Now?, mostra que as mais de 160 firmas envolvidas na compra e venda de ações estão acelerando a adoção de IA em suas práticas.

Dois terços (70%) das empresas ouvidas estão em estágio de planejamento ou pesquisa para implementar IA/Machine Learning para uso no processo de decisão de investimentos. Embora os orçamentos da IA ainda sejam considerados modestos (média de US$ 500 mil), a maioria das empresas ouvidas planeja aumentar o investimento nas tecnologias nos próximos 12 meses.

"Nossa pesquisa revelou que o principal obstáculo para a adoção de IA era a qualidade dos dados, com mais da metade dos entrevistados citando isso como seu maior desafio", diz Tim Cave, analista do TABB Group. Depois da qualidade dos dados, outras preocupações das Bolsas e do ecossistema são o recrutamento de talentos e, claro, a regulamentação e a conformidade, já que o setor é severamente escrutinizado e regulamentado.

Mas a principal conclusão do estudo é que a maioria dos participantes do mercado de capitais está otimista quanto ao uso de IA e Big Data no futuro próximo. “Está no topo da agenda de mudanças na maioria das empresas, com o principal caso de uso no processo de investimento, mas também na execução de operações”, diz Cave.

Um outro estudo, batizado de Enhanced Bankers – The Impact of AI, produzido também pelo TABB Group, mostra que o uso de IA e Machine Learning é bem recebido por 83% dos banqueiros dos EUA ouvidos, encantados com a ideia de usar IA para identificar oportunidades de vender mais para os clientes. Os insights gerados por Machine Learning aumentam o entendimento das oportunidades e a automação desse processo muda tudo.

Os gastos com RegTech estão crescendo 48% ao ano desde 2017, segundo um relatório da Juniper Research, devendo saltar de US$ 10,6 bilhões em 2017 para US$ 76,3 bilhões em 2022. O movimento não surpreende já que, desde a crise financeira de 2008 os bancos já pagaram US$ 340 bilhões em multas (dados atualizados de fevereiro de 2019).

A lista dos multados foi compilada pela Keefe, Bruyette and Woods. Em primeiro lugar vem o Bank of America, com US$ 76 bilhões em multas, seguido pelo JPMorgan Chase (US$ 44 bilhões). Muitos outros foram multados em mais de US$ 10 bilhões e apenas 13 bancos já respondem por 93% de todas as multas. Na média, o gasto com compliance ;e mais de US$ 1 bilhão por ano, o que em média representa 10% dos custos operacionais da maioria dos bancos.

Para fugir dessas multas, particularmente daquelas ligadas à conformidade baseada em riscos, os bancos precisam gastar muito mais tempo e recursos humanos analisando detidamente papéis e informações que, em sua maioria estão armazenadas na forma não estruturada, diz o analista responsável pela pesquisa do TABB Group, Terry Roche, veterano no setor de FinTechs.

"Não é algo que os humanos possam acompanhar, dado o ritmo e a amplitude dos dados... Limpar manualmente e classificar palavras-chave de milhões de mensagens de e-mail, por exemplo, pode ser simplesmente impossível", diz Roche. Por isso o uso de Machine Learning é um caminho sem volta, porque muda o jogo de decisões sobre hipóteses para decisões sobre dados.

A IA nos tornará mais humanos

O cientista da computação Kai-Fu Lee tem uma jornada de mais de 30 anos em Inteligência Artificial. Trabalhou na Apple, SGI, Microsoft (responsável pelo Microsoft Research Lab), e é ex-presidente do Google China. Atualmente é um dos maiores investidores de tecnologia da China. CEO, chairman e fundador do Sinovation Ventures, um fundo de investimentos em high-tech de US$ 1,7 bilhão, Lee também é presidente do Sinovation Ventures Artificial Intelligence Institute.
Seu livro recente, AI Superpowers: China, Silicon Valley, and the New World Order é um best-seller da área. Nessa palestra do TED, Lee, acredita que a IA vai substituir 40% dos empregos humanos nos próximos 15 anos, mas que a tecnologia não é capaz de substituir a humanidade."IA é serendipidade. Está aqui para nos libertar dos trabalhos rotineiros e está aqui para nos lembrar do que nos faz humanos."

3 armadilhas de Machine Learning

Três armadilhas comuns no Machine Learning devem ser evitadas por todos os que fazem uso das ferramentas de insights e predição de padrões, alerta Patrick Riley, principal engenheiro e pesquisador sênior da equipe do Google Accelerated Science, em artigo recente na Nature.  São elas:

  1. A divisão de dados de forma inadequada para treinamento e teste – É preciso lembrar que “os contextos nos quais os dados foram coletados podem ser diferentes de como o modelo de aprendizado de máquina deve ser usado”, diz ele.
  2. As variáveis ocultas, geralmente não intencionais – “Use vários modelos use vários modelos para detectar variáveis inesperadas”, recomenda.
  3. Objetivos óbvios e/ou confusos – “O objetivo geral deve ser mantido em mente, ou produziremos sistemas precisos que respondam as perguntas erradas”, adverte.

Para manter esses pontos sob controle, o caminho mais adequado é o do estabelecimento de padrões sobre como calibrar as ferramentas; realizar e relatar o processo; aplicar seus algoritmos e questioná-los apropriadamente.

“Estamos em um ponto incrível - poder computacional, dados e algoritmos se unindo para produzir grandes oportunidades para descobertas com o auxílio do aprendizado de máquina. É nossa responsabilidade, como comunidade científica, garantir que aproveitemos bem essa oportunidade”, afirma Riley.

Sua empresa é cognitiva?

Cognitive Enterprises, ou organizações cognitivas, é o tema de um estudo produzido pelo IBM Institute for Business Value. O documento - A Organização Cognitiva: reinventando a sua empresa com Inteligência Artificial (IA) - vale a leitura para reflexão.

São 64 páginas detalhando os sete passos que as empresas precisam dar para avançar para a segunda fase do que a IBM considera a jornada da transformação digital: mudar de um modelo “de fora para dentro” da última década, para o potencial “de dentro para fora” dos dados explorados com tecnologias exponenciais como IA, Big Data e Analytics. E recheados de links para leituras adicionais.

"A transformação de dentro para fora traz consigo o ato de explorar as informações que a empresa já tem, mas de forma inteligente. 80% dos dados das empresas não são utilizados como vantagem competitiva. Empresas que usam seus dados de dentro de casa para extrair novos modelos de negócio e plataformas são cognitivas", diz Fabricio Lira, Executivo de Data & AI da IBM Brasil, em entrevista à The Shift.

O movimento envolve aproveitar os ativos valiosos que já estão dentro das organizações para gerar novos negócios que, por sua vez, geram valor e capturam novamente mais valor do ecossistema. É um conceito de rede que se estabelece, que se materializa em plataformas. E não é volume de dados que vai determinar o sucesso, é qualidade dos dados que impacta o treinamento da IA, por exemplo.

Por isso a sugestão dos sete passos, que envolvem medidas de preparação de toda a empresa precisa para trabalhar com as tecnologias exponenciais. Por exemplo, estar aberta a implementar processos ágeis que permitem errar e mudar rapidamente, e democratizar o acesso aos dados. "A IA cruza domínios corporativos de forma muito simples, por isso as empresas precisam se preparar internamente para tirar todo proveito dela. Ela não pode ser contida. E precisa cada vez mais incorporar as informações que estão espalhadas pela empresa", diz Lira.

Confira as 7 ações abaixo:

  1. Criar plataformas para possibilitar a vantagem competitiva
  2. Aproveitar a vantagem incumbente nos dados
  3. Preparar a empresa para mudança
  4. Reformular fluxos de trabalho da empresa em torno da I.A
  5. Agilizar, desenvolver e alterar rapidamente
  6. Reiventar a força de trabalho para gerar talentos
  7. Confiança e segurança

Sales Tech em rota direta para uso de IA

A tecnologia utilizada em vendas no mundo todo está acelerando na direção do uso intensivo de Inteligência Artificial. O infográfico preparado pela Raconteur mapeia o mundo de Sales Tech, de social selling ao score preditivo de leads. Globalmente, 40% dos profissionais de vendas usam ou estão implementando a tecnologia da IA ​​em seus fluxos de trabalho para automatizar ou agilizar as vendas. Empresas que automatizaram seus formulários de respostas de contato, por exemplo, conseguiram um aumento de 71% em taxas de abertura e 152% em taxas de cliques.

O "Megatron" da Nvidia bate recordes

A plataforma de Deep Learning da Nvidia, baseada em GPU, para desenvolver e executar IA que entende e responde a solicitações de linguagem natural, bateu um recorde esta semana que pode ter impactos importantes para empresas de todos os tamanhos. E usando código open source, escrito em PyTorch e fácil de executar.

Os recordes incluem a quebra da marca de tempo de treinamento BERT, um dos modelos de linguagem AI mais avançados do mundo, considerado um bom padrão para o processamento de linguagem natural. A plataforma AI da Nvidia treinou o modelo em menos de uma hora (53 minutos), e o modelo treinado poderia inferir com sucesso (ou seja, gerar resultados a partir do aprendizado) em dois milissegundos (10 milissegundos é considerado alto na indústria).

O grupo de pesquisas da Nvidia também construiu e treinou o maior modelo de linguagem já baseado em "Transformers", que é a tecnologia que também serve de base ao BERT, que inclui 8,3 bilhões de parâmetros, tornando-o 24 vezes o tamanho do BERT-Large, o maior modelo atual de BERT. A Nvidia batizou o modelo de "Megatron" e liberou o código PyTorch usado para que outros possam treinar seus próprios modelos em Transformer. O vídeo mostra a importância do investimento nesse tipo de IA conversacional.

O garimpo da semana

  • Negócios não querem IA. Negócios querem resultados. Por isso, o BPM e o RPA podem, sim, engolir as Advanced Analytic Platforms, o Machine Learning e o Deep Learning. A opinião é do cientista de dados William Vorhies, editor contribuinte do Data Science Central. Você concorda?
     
  • Uma nova corrida armamentista, envolvendo IA e a China, será ruim para a humanidade. O debate esquentou de vez depois de Peter Thiel, fundador da PayPal, sustentar que a Inteligência Artificial é "uma tecnologia militar", em editorial provocativo do The New York Times.
     
  • Como os cérebros humanos aprendem? A IA pode ajudar a responder. Depois que o backprop fomentou grandes avanços no reconhecimento de imagens, alguns cientistas começaram a se perguntar se o cérebro não poderia fazer algo semelhante. "Estamos olhando para a ação de muitas sinapses e esse é o problema que o backprop resolve [nas máquinas]", diz o neurocientista Aaron Batista, da Universidade de Pittsburgh. Artigos recentes, publicados na ScienceDirect, Cornell University e Frontiers, abordam essa questão.
     
  • A fusão com IA seria suicídio para a mente humana?  Os obstáculos filosóficos são tão prementes quanto os tecnológicos.
     
  • Uma boa compreensão da álgebra linear é essencial para entender e trabalhar com muitos algoritmos de Machine Learning e, especialmente, os de Deep Learning.
     
  • Especialistas forenses digitais estão buscando ativamente mecanismos mais seguros para detecção de Deepfakes, em uma corrida contra o tempo por conta das eleições americanas de 2020. A ideia é manter os candidatos presidenciais a salvo de ataques. O problema é que a detecção é um jogo de gato e rato. Algoritmos podem ser rapidamente treinados para evitar as falhas depois de identificadas, dificultando a identificação da manipulação.
     
  • Como um gerenciamento cuidadoso na implementação da IA pode ajudar a evitar danos não intencionais, porém significativos, para a reputação da marca e, ainda mais importante, para os trabalhadores, indivíduos e a sociedade como um todo.
     
  • A equipe de IA da DeepMind, que derrotou os grandes mestres do xadrez e os campeões do Go, está focada agora em dominar a biologia computacional.
     
  • A autonomia total ainda é uma realidade distante para os carros autônomos. Mas a autonomia parcial já é uma fonte potencial de vantagem competitiva para a Tesla, e poderá continuar sendo também no longo prazo.
     
  • Em muitas cidades, os dados já são o combustível da mobilidade urbana.

Conheça nossa proposta de jornalismo. 
Indique para amigos. Se recebeu de um amigo, ASSINE e tenha a sua.

Cristina De Luca & Silvia Bassi

Share
Tweet
email
Copyright © 2019 The Shift, Todos os direitos reservados.


Você pode atualizar suas preferências ou descadastrar-se da lista.