Dr. Alexander Scarlat explica os principais conceitos da aprendizagem de máquina em sua série de 12 partes "Machine Learning Primer for Clinicians". Nas primeiras sete partes abrangem aspectos de definição de aprendizado de máquina, seguidos de exemplos que demonstram aspectos do desempenho de modelos de aprendizado de máquina em medicações. A série usa gráficos animados no lugar da matemática para ajudar os leitores a entender os conceitos de aprendizado de máquina.
A série começa enfocando as deficiências nos algoritmos tradicionais baseados em regras e, ao mesmo tempo, explicando que o aprendizado de máquina pode superar esses mesmos desafios. Os desafios incluem problemas multidimensionais e limitações humanas às regras do programa estatístico.
Scarlat constrói efetivamente uma taxonomia de conceito de aprendizado de máquina para o leitor. Em um nível alto, a série explica as formas supervisionadas, não supervisionadas e outras formas de aprendizado de máquina. Treinamento supervisionado inclui regressão e classificação. Não supervisionado inclui clustering e detecção de anomalias. Outras formas de aprendizado de máquina incluem métodos conjuntos e modelos generativos. Toda a série de artigos segue uma abordagem semelhante à elaboração progressiva de uma taxonomia de conceitos definidores de aprendizagem de máquina.
Na parte quatro, Scarlat explica as limitações e requisitos para o pré-processamento de dados usados no aprendizado de máquina. O pré-processamento inclui o nivelamento de dados relacionais, a adição de valores quando ausentes, a conversão de texto em matrizes esparsas ou vetores, usando valores binários em dimensões vetoriais separadas para categorias. Além disso, Scarlat cobre a necessidade de normalização de valores para evitar uma falsa sensação de significância em magnitude e a maldição da dimensionalidade.
A quinta parte da série de artigos descreve como os algoritmos de aprendizado de máquina aprendem, incluindo o uso de pesos, métricas para desempenho, perda (ou custo), usando um otimizador, propagação avançada e retropropagação. Além disso, na parte sete, informações adicionais são encontradas sobre o fluxo de trabalho da criação de um modelo de aprendizado de máquina, incluindo underfitting, overfitting, treinamento, validação, teste, taxa de aprendizado, aumento de dados, uso de regularizadores e uso de dropout.
Scarlat completa os textos usando quatro diferentes problemas do mundo real e exemplos de soluções para explicar a avaliação do desempenho dos modelos de aprendizado de máquina. Seus títulos de artigos incluem:
- Previsão da Mortalidade
- Previsão do tempo de permanência
- Detecção de Anomalias em Antibiogramas
- Identificação de Melanoma
Os exemplos comunicam as métricas de desempenho, incluindo precisão, acurácia, recuperação, área sob a curva e pontuação F1. Além disso, o último modelo mostra como os modelos existentes de aprendizado de máquina podem ser usados para transferir aprendizado e minimizar o treinamento adicional de modelos.
Tópicos adicionais que permitem a adoção do aprendizado de máquina na área da saúde incluem: identificar os processos para usar o aprendizado de máquina, integração com sistemas de registros eletrônicos de saúde (EHR) existentes e captura de resultados de cuidados. O Google AI aplica o aprendizado de máquina aos registros EHR de pacientes com foco em escalabilidade, precisão e interpretabilidade.