Login| Sign Up| Help| Contact|

Patent Searching and Data


Title:
METHOD FOR DETECTION AND CLASSIFICATION OF NON-PERIODIC SIGNALS AND THE RESPECTIVE SYSTEM THAT IMPLEMENTS IT
Document Type and Number:
WIPO Patent Application WO/2021/125987
Kind Code:
A1
Abstract:
The invention relates to a new method for the detection and classification of non-periodic signals and to the system that implements same, in the field of flow cytometry techniques for the acquisition of biological information, in order to increase the accuracy in the detection of labeling particles. This is achieved through the use of classifiers of the composed or independent type (20), which apply machine learning techniques, such as ANN (Artificial Neural Networks) (2), to an input signal, in order to execute a new detection methodology that combines the filtering and decision steps, as a way to classify non-periodic signals at the output of the classifier (3).

Inventors:
MIGUEL BÁRBARA COROAS PRISTA CAETANO DIOGO (PT)
GIBRAN RABUSKE KUNTZ TAIMUR (PT)
GONÇALO NETO SILVA JOÃO (PT)
MANUEL DOS SANTOS RIBEIRO FERNANDES JORGE (PT)
NUNO GOMES TAVARES GONÇALO (PT)
Application Number:
PCT/PT2020/050052
Publication Date:
June 24, 2021
Filing Date:
December 16, 2020
Export Citation:
Click for automatic bibliography generation   Help
Assignee:
INST SUPERIOR TECNICO (PT)
INESC ID INSTITUTO DE ENGENHARIA DE SIST E COMPUTADORES INVESTIGACAO E DESENVOLVIMENTO DE LISBOA (PT)
International Classes:
G01N15/10; G01N15/14; G05B13/02; G16B40/00
Domestic Patent References:
WO2019067557A12019-04-04
WO2020030903A12020-02-13
Foreign References:
US20180286038A12018-10-04
US6636623B22003-10-21
US6736978B12004-05-18
US9934364B12018-04-03
Other References:
CHÍCHARO, A.MARTINS, M.BARNSLEY, L. C.TAOUALLAH, A.FERNANDES, J., ENHANCED MAGNETIC MICROCYTOMETER WITH 3D FLOW FOCUSING FOR CELL ENUMERATION, 2018
SOARES, R.MARTINS, V. C.MACEDO, R.CARDOSO, F. A.MARTINS, S. A.CAETANO, D. M.HENRIQUES, P.SILVÉRIO, V.CARDOSO, S.FREITAS, P. P.: "Go with the flow: advances and trends in magnetic flow cytometry", ANALYTICAL AND BIOANALYTICAL CHEMISTRY, vol. 411, no. 9, 2019, pages 1839 - 1862, XP036771368, DOI: 10.1007/s00216-019-01593-9
HUANG, C.X, Z.YING, D.HALL, D.: "A GMR-based magnetic flow cytometer using matched filtering", IEEE SENSORS, 2017, pages 1 - 3, XP033281126, DOI: 10.1109/ICSENS.2017.8233892
LOUREIRO, J.ANDRADE, P. Z.CARDOSO, SSILVA, C. L.CABRAL, J. M.FREITAS, P. P.: "Magnetoresistive chip cytometer", LAB ON A CHIP, 2011, pages 2255 - 2261
Attorney, Agent or Firm:
LIMA, Patrícia (PT)
Download PDF:
Claims:
REIVINDICAÇÕES

1. Método de deteção e classificação de sinais não periódicos emitidos por alvos biológicos no âmbito de técnicas de Citometria de fluxo, o referido método sendo caracterizado por compreender as seguintes etapas:

— aquisição de pelos menos uma sequência temporal (51) gerada por um sensor de deteção;

— filtragem do sinal produzido pelo sensor, baseada na sua banda máxima;

— extração e armazenamento de candidatos a impulsos por implementação de um algoritmo de decisão liberal, baseado em valores limiares de desvio padrão de ruido;

— filtragem individual de cada candidato a impulso, de acordo com a banda de maior energia de cada um;

— classificação, compreendendo dois estágios sequenciais de aprendizagem automática; um primeiro estágio, classificador detetor (53), adaptado a classificar um candidato a impulso como impulso ou não-impulso; um segundo estágio, classificador avaliador (58), adaptado a classificar os impulsos, identificados no primeiro estágio, como partícula marcante associada a alvo biológico ou como aglomerado de partículas;

— contagem do número de impulsos classificados como partícula marcante associada a alvo biológico no evento de deteção (59).

2 . Método de acordo com a reivindicação 1, caracterizado por a etapa de classificação implementar métodos regressores e algoritmos de extração de características (6) da sequência temporal (51) que servem de entrada aos dois estágios de aprendizagem automática, classificadores (53, 58).

3. Método de acordo com a reivindicação 2, caracterizado por as caracteristicas extrapoladas serem dependentes da técnica de Citometria a executar.

4 . Método de acordo com a reivindicação 3, caracterizado por as caracteristicas extrapoladas serem a velocidade do alvo ou da nanoparticula magnética, o ângulo de magnetização, a distância ao sensor ou o tamanho do alvo, no caso de a técnica de Citometria a executar ser a Citometria de Fluxo magnético - CFM.

5 . Método de acordo com a reivindicação 3, caracterizado por as caracteristicas extrapoladas serem a velocidade do alvo no canal, o tamanho do alvo ou a densidade do conteúdo do alvo, no caso de a técnica de Citometria a executar ser a Citometria de Fluxo ótico - CFO.

6. Método de acordo com qualquer uma das reivindicações anteriores, caracterizado por os dois estágios de aprendizagem automática, classificadores (53, 58), a executar na etapa de classificação, serem alimentados a partir de conjuntos de treino (54, 55), em que, o primeiro estágio de aprendizagem automática, classificador detetor (53), é treinado (56) com um conjunto de treino (54) composto por exemplos de impulsos, exemplos de ruido e interferências, e por exemplos de não-impulsos; e o segundo estágio de aprendizagem automática, classificador avaliador (58), é treinado (56) comum conjunto de treino (55) composto por exemplos de impulsos de partícula marcante associada a alvo biológico e exemplos de impulsos de aglomerado.

7 . Método de acordo com a reivindicação 6, caracterizado por o conjunto de treino (54) que alimenta o primeiro estágio de aprendizagem automática, classificador detetor (53), estar adaptado a identificar impulsos da família gaussiana; os referidos impulsos gaussianos sendo do tipo bipolar no caso de CEM ou monopolares no caso de CFO.

8. Método de acordo com a reivindicação 6 ou 7, caracterizado por o conjunto de treino (54) que alimenta o primeiro estágio de aprendizagem automática, classificador detetor (53), ser gerado a partir de 3 passos de expansão:

— geração de uma sequência temporal de amostras resultantes de simulações digitais adaptadas a modelar a interação entre uma partícula marcante e um sensor de deteção; as referidas sequências temporais sendo posteriormente amostradas;

— adição a cada uma das sequências temporais amostradas, de ruído com características similares ao ruído produzido num citómetro;

— geração de um conjunto de não-impulsos, através da geração de ruído e eventos similares a interferências .

9. Método de acordo com a reivindicação 8, caracterizado por a amostragem das sequências temporais resultantes das simulações digitais envolver:

— um processo de reamostragem com diferente número de amostras; ou

— interpolação da simulação digital.

10 . Método de acordo com as reivindicações 8 ou 9, caracterizado por a adição de ruído envolver: — a adição de ruido de diferentes potências a cada impulso; e

— a adição a um mesmo impulso de vários conjuntos de amostras aleatórias de ruido com a mesma potência.

11 . Método de acordo com qualquer uma das reivindicações 8 a 10, caracterizado por o ruido, no passo de geração de não-impulso, ser gerado a partir de amostras aleatórias com desvios padrões iguais ou similares ao ruido adicionado aos impulsos no passo de adição de ruido; e por a interferência ser gerada através de impulsos monopolares de diferentes intensidades e durações.

12 . Método de acordo com qualquer uma das reivindicações anteriores, caracterizado por o segundo estágio de aprendizagem automática, classificador avaliador (58), estar configurado para distinguir um impulso, proveniente de uma partícula marcante associada a alvo biológico, de um impulso gerado a partir de um aglomerado de partículas; a referida distinção incluindo os passos de:

— extrapolação de características da sequência temporal em análise;

— execução de um algoritmo de avaliação que tem como entrada a sequência temporal (51) de um impulso marcado no primeiro estágio de aprendizagem automática como impulso e as características extraídas da sequência temporal (51).

13. Método de acordo com qualquer uma das reivindicações anteriores, caracterizado por incluir uma etapa adicional de pré-processamento (52) antes dos classificadores (53, 58); a referida etapa de pré- processamento (52) envolve o passo de deteção de um candidato a impulso baseado em limiares de amplitude e número de amostras; a referida deteção por limiares recorrendo a medição pseudo-diferencial onde a sequência temporal gerada por um sensor de deteção é subtraída à sequência temporal gerada por um sensor de referência.

14 . Método de acordo com qualquer uma das reivindicações anteriores, caracterizado por entre o primeiro estágio de aprendizagem automática, classificador detetor (53), e o segundo estágio de aprendizagem automática, classificador avaliador (58), ser executado uma nova etapa de pré-processamento (52) onde cada impulso identificado no primeiro estágio, classificador detetor (53), é filtrado através de um filtro adaptado de banda plana e atraso de fase linear.

15 . Método de acordo com a reivindicação 14, caracterizado por o filtro ser digital e possuir uma banda de passagem adaptada para conter uma percentagem específica da energia contida na sequência temporal; a percentagem de energia sendo determinada através de uma análise espectral.

16. Sistema para deteção e classificação de sinais não periódicos caracterizado por compreender:

— Pelo menos um classificador adaptado a executar algoritmos de aprendizagem automática; o referido classificador sendo composto por dois classificadores (53, 58);

— Cada classificador (53, 58) sendo formado por pelo menos uma rede neuronal artificial (2), e estando adaptado a executar o método das reivindicações 1 a 15.

17 . Sistema de acordo com a reivindicação 16, caracterizado por cada classificador (53, 58) compreender adicionalmente uma máquina de vetores de suporte (4); em que a saida da referida máquina (4) é uma entrada da rede neuronal artificial (2). 18 . Sistema de acordo com a reivindicação 17, caracterizado por cada classificador (53, 58) compreender adicionalmente pelo menos um regressor (5), em que pelo menos um regressor (5) está adaptado a estimar as variáveis utilizadas na simulação digital tais como: posição no canal, velocidade ou tamanho do alvo; e a saida de um regressor (5) é uma entrada da rede neuronal artificial (2).

19. Sistema de acordo com a reivindicação 18, caracterizado por cada classificador (53, 58) compreender uma rede neuronal artificial (2) composta por:

— I entradas, resultantes da soma entre:

— o número de amostras extraídas de uma sequência temporal (51), o número de características F extraídas dessa mesma sequência temporal (51), o número de saídas de regressores (5) e a saída da máquina de vetores de suporte (4);

— n° de saídas = log2[nQ declasses\+ 1.

Lisboa, 16 de dezembro de 2020.

Description:
DESCRIÇÃO

"MÉTODO DE DETEÇÃO E CLASSIFICAÇÃO DE SINAIS NÃO PERIÓDICOS E RESPETIVO SISTEMA QUE O IMPLEMENTA"

CAMPO DA INVENÇÃO

A presente invenção enquadra-se na área técnica da Citometria. Nesse contexto, a invenção relaciona-se com métodos de deteção de partículas, especificamente, alvos biológicos para aquisição de informação biológica, através de Citometria de fluxo. Ainda mais particularmente, a presente invenção diz respeito a um classificador para identificação de alvos biológicos.

ANTECEDENTES DA INVENÇÃO

O aumento na necessidade de informação biológica ao nivel da unidade de célula levou ao desenvolvimento de tecnologias de Citometria melhoradas. A Citometria de fluxo em particular é um método poderoso que evoluiu muito nas últimas décadas. Devido à complexidade dos dispositivos usados nesta técnica, é possível identificar um número cada vez mais elevado de parâmetros celulares. No entanto, este aumento em complexidade e precisão também causou um aumento no custo da produção de equipamentos. Por outro lado, com o amadurecimento das técnicas de fabricação de canais de microfluídica, passou a ser possível criar equipamentos mais pequenos e de uso no ponto de atendimento. Estes equipamentos são, regra geral, mais simples e baratos, produzindo, no entanto, um grau de precisão inferior e uma redução do número de parâmetros identificados. A procura pelo aumento da precisão e pela obtenção de maior quantidade de informação nestes pequenos dispositivos tornou-se uma área de investigação em si própria. Um citómetro de fluxo é tipicamente compreendido pelos seguintes elementos: pelo menos um canal, geralmente com uma secção na ordem dos micrómetros quadrados e de comprimento arbitrário, onde se encontra disposta uma amostra biológica suspensa em meio liquido em fluxo; uma fonte de excitação, por exemplo do tipo laser, adaptada a direcionar um feixe de luz para o meio liquido em fluxo, ou um campo magnético aplicado, cujo propósito é transferir um caráter mensurável aos alvos; um conjunto de sensores utilizado para detetar partículas marcantes presentes na amostra biológica; e uma unidade de processamento, configurada para adquirir, processar e analisar os sinais gerados pelo conjunto de sensores na sequência de eventos de deteção .

Os citómetros de fluxo magnéticos (CEM) são um dos exemplos destas plataformas, muitas vezes portáteis e de grande potencial (US6736978 Bl). Neste caso, os sensores mais comummente utilizados usam o efeito quântico da Giant Magnetoresístance ou efeito de Tunnel Magnetoresístance (Soares, et al., 2019). Uma vez que existe muito pouco ou nenhum conteúdo magnético em amostras biológicas, a utilização de CEM está dependente do carregamento de alvos biológicos, com marcadores que apresentem comportamento magnético, de forma a que estes, sob determinadas condições, possam produzir um sinal com componente magnética e, dessa forma, serem detetados pelo conjunto de sensores. Analogamente à Citometria de fluxo ótica (CFO), baseada em fluoróforos, também um CEM recorre a sondas biológicas tais como anticorpos, virus, RNA, entre outras, que tenham afinidade para certos locais nos alvos. Na CEM,estas sondas são carregadas com elementos magnéticos ou paramagnéticos - polarizados por um campo magnético de excitação - que permitem a sua deteção por sensores magnéticos. Para tal, a amostra biológica carregada é passada momentaneamente dentro do canal do CFM, de forma a estar tão próxima do(s) sensor (es) quanto possível. Ora, da execução do processo acima descrito surgem vários desafios relacionados quer com a deteção do sinal produzido pelos alvos biológicos em ambiente ruidoso, quer com a distinção entre o sinal produzido pelos alvos biológicos e os marcadores magnéticos livres - sondas biológicas - usados para os detetar. No estado da técnica, a deteção de sinais produzidos por partículas marcantes é, maioritariamente, realizada através de deteção de picos por aplicação de limiares e algoritmos de decisão baseada em heurística (Chícharo, et ai., 2018; Huang, et al., 2017; Soares, et al., 2019; US99934364 Bl). A aplicação de limiares é muito vulnerável a picos causados por ruído aleatório e por interferências. Para mitigar esta vulnerabilidade, a maioria dos sistemas recorre à aplicação de filtragem passa-banda que, no entanto, é de banda geral e normalmente determinada por limitações no sistema de amostragem e não pelas características do sinal, o que faz com que não seja ótima. Por sua vez, a amplitude do sinal é determinada pela proximidade da partícula a detetar - no caso de CFM, tratam-se de nanopartícuias (para)magnéticas (NPM) - ao conjunto de sensores e pelo respetivo conteúdo magnético. No caso de CFO, a intensidade do sinal está relacionada com a intensidade da excitação aplicada aos fluoróforos, características dos próprios fluoróforos, índice de refração e reflecção dos alvos, o conteúdo interno dos alvos, entre outros fatores.

Considerando como exemplo explicativo a CFM, a banda do sinal é determinada pelo tipo e duração do impulso, que depende da velocidade do alvo no fluxo, do tamanho das NPM e do tamanho e forma do sensor. No mesmo fluxo, podem existir NPMs a se deslocarem a várias velocidades, o que leva a que normalmente a banda de passagem seja estabelecida considerando o impulso de banda máxima. Esta abordagem é ineficiente porque não maximiza a relação sinal-ruído para impulsos de banda mais fina.

Nesse sentido, várias estratégias podem ser implementadas para melhorar a relação sinal-ruído, das quais se destacam as abordagens divulgadas em Huang, et al., 2017, Chícharo, et al., 2018. Estas abordagens dividem-se em duas categorias: adaptação do filtro ao sinal (Huang, et al.,

2017) ou adaptação do sinal ao filtro (Chícharo, et al.,

2018). No entanto, apesar de mais eficientes e personalizadas, as abordagens referidas não permitem uma total adaptação ao nível do impulso individual e da própria experiência, sendo forçadas a manter um certo nível de generalização em relação ao impulso detetado para não perder, à partida, possíveis candidatos (ex: sinais de banda mais larga). Ao mesmo tempo, são obrigadas a ser muito específicas no critério de decisão. Por exemplo, para minimizar o número de falsos positivos originados por ruído e interferências, o limiar de decisão em amplitude aplicado é normalmente cerca de 4-5 vezes superior ao desvio padrão do ruído, o que limita a deteção a sinais com relação sinal-ruído largamente positiva.

PROBLEMAS TÉCNICOS RESOLVIDOS

Os métodos conhecidos no estado da arte para deteção de sinais não periódicos, tais como os produzidos por partículas marcantes associadas a alvos biológicos, no âmbito de técnicas de Citometria de fluxo para aquisição de informação biológica, revelam-se inadaptados a proporcionar uma deteção otimizada do sinal produzido pelos alvos biológicos em ambiente ruidoso, estando os seus limites e especificações definidos em função de casos extremos e não por impulsos individuais produzidos pelos referidos alvos biológicos. Neste contexto, um impulso individual é gerado pela interação entre partículas marcantes, que podem ou não estar associadas a alvos biológicos, e os sensores.

Especialmente para funções como a proposta em Loureiro, et al., 2011 e Chícharo, et al., 2018, onde o CEM é utilizado para contar células tumorais, é fundamental que a eficácia e precisão da medição sejam 100% ou perto disso, em vez das percentagens mais reduzidas reportadas na literatura (Soares, et al., 2019). De facto, as células tumorais são muito raras e a perda de qualquer uma delas na contagem impacta significativamente o diagnóstico ou prognóstico da doença. Também na deteção de agentes patogénicos usados em armamento químico, na deteção de bactérias multirresistentes e agressivas, ou no controlo da qualidade das águas, entre outras, é necessária precisão que os métodos conhecidos não conseguem garantir, fruto das suas limitações: apresentam bandas de sinal limitadas por hardware, recorrem a etapas de filtragem complexas e ineficazes, ou estabelecem limites para os parâmetros da medida num esforço para maximizar a relação sinal-ruído. Para além disso, os algoritmos de decisão são, geralmente, simples, o que não se coaduna com a complexidade que a etapa de filtragem exige.

Na presente invenção, propõe-se uma nova abordagem para a deteção e classificação do sinal gerado por partículas marcantes associadas a alvos biológicos, no âmbito de técnicas de Citometria de fluxo para aquisição de informação biológica, o que permite um aumento de precisão na deteção, ultrapassando as limitações identificadas nos métodos do estado da arte.

SUMÁRIO DA INVENÇÃO

É assim objeto da presente invenção um novo método para a deteção e classificação de sinais não periódicos e respetivo sistema que o implementa, no âmbito de técnicas de Citometria de fluxo para aquisição de informação biológica, com o objetivo de aumentar a precisão na deteção de partículas marcantes associadas a alvos biológicos.

Tal é atingido através do recurso a um classificador que se baseia em técnicas de aprendizagem automática para executar uma nova metodologia de deteção que combina as etapas de filtragem e de decisão. Desta forma, coloca-se mais inteligência no algoritmo de decisão e consegue-se uma personalização do filtro para cada impulso gerado pela interação entre partículas marcantes, associadas a alvos biológicos ou não, e os sensores de deteção.

0 classificador é aplicado à deteção de sinais não periódicos, em particular, impulsos do tipo da família gaussiana, de característica bipolar ou monopolar, permitindo distinguir um sinal produzido por uma partícula marcante de apenas ruído ou interferências, e, assim, proporcionar um aumento na precisão da deteção de alvos biológicos numa amostra biológica.

DESCRIÇÃO DAS FIGURAS

A Figura 1 descreve a arquitetura de um classificador do tipo composto da presente invenção, onde os sinais numéricos de referência significam:

(1) - sinal de entrada do classificador;

(2) - RNA - redes neuronais artificiais;

(3) - saida do classificador;

(4) - MVS - máquina de vetores de suporte;

(5) - regressor;

(6) - algoritmo de extração de características;

(10) - classificador composto.

A Figura 2 representa a arquitetura de um classificador do tipo independente da presente invenção, onde os sinais numéricos de referência significam: (1) - sinal de entrada do classificador;

(2) - RNA;

(3) - saida do classificador;

(20) - classificador independente.

A Figura 3 representa a simulação da interação de um dipolo magnético com um sensor.

A Figura 4 representa o sinal filtrado (41) resultante da aplicação do filtro adaptado de banda plana a uma sequência temporal que contém um impulso (42) bipolar, nela também podendo ser vistos os limiares superior (43) e inferior (44) utilizados para a seleção.

A Figura 5 representa o fluxograma ilustrador do método da invenção (50), onde os sinais de referência numéricos significam:

(51) - sequência temporal;

(52) - etapa de pré-processamento;

(53) - classificador detetor;

(54) - conjunto de treino impulsos vs. não-impulso;

(55) - conjunto de treino partícula marcante associada a alvo biológico vs. aglomerado;

(56) - etapa de treino;

(57) - etapa de eliminação;

(58) - classificador avaliador;

(59) - evento de deteção.

A Figura 6 ilustra um exemplo do sinal gerado pelo mesmo número de partículas quando estão aglomeradas em si mesmas ou marcam um alvo biológico, onde os sinais numéricos de referência significam:

(61) - sinal gerado por aglomerado; (62) - sinal gerado por partícula marcante associada a alvo biológico.

DESCRIÇÃO DETALHADA DA INVENÇÃO

A presente invenção diz respeito a um método (50) e respetivo sistema que o implementa, de processamento de sinal para deteção de sinais não-periódicos, em particular, impulsos da família gaussiana, presentes numa sequência no tempo de duração limitada (doravante apenas designada por sequência temporal)(51), e gerados por sensores responsáveis por detetar sinais emitidos por alvos biológicos no âmbito de técnicas de Citometria de fluxo para aquisição de informação biológica. Ao longo da descrição, os termos sinal e sequência temporal serão utilizados para descrever tanto o método (50) como o sistema da invenção. Nesse contexto, por sinal deverá entender-se o resultado do processamento efetuado pelo sistema, a cada instante, de um conjunto limitado de dados que constitui uma sequência temporal.

Em particular, a presente invenção está relacionada com um classificador baseado em aprendizagem automática, que permite um aumento de precisão na deteção de partículas marcantes associadas a alvos biológicos.

O classificador proposto combina etapas de filtragem e de decisão. Primeiro, é feita uma filtragem geral ao sinal produzido pelo sensor, baseada na sua banda de frequência máxima produzida pelos eventos mais rápidos, como nas abordagens já conhecidas. De seguida é implementado um algoritmo de decisão liberal, que não necessita de minimizar falsos positivos, baseado em limiares (43, 44) que podem estar mais próximos do desvio padrão do ruído, estimado por análise dos momentos iniciais da experiência onde ainda não estão presentes sinais de interesse. Os possíveis impulsos são extraídos e guardados. Cada possível impulso (42) é avaliado individualmente e filtrado de acordo com a banda onde possui maior energia, resultando num sinal filtrado (41) mais limpo. Posteriormente, é aplicado um classificador de decisão baseado em aprendizagem automática, designado classificador detetor (53), para classificação dos impulsos: impulsos classificados positivamente são avaliados por um subsequente classificador de aprendizagem automática, designado classificador avaliador (58). Ambos os classificadores (53) e (58) podem ser do tipo independente (20) ou composto (10). No caso do tipo composto (10), por observação da natureza do sinal, extrapolam-se caracteristicas diversas, consoante a técnica de Citometria que se está a utilizar. Por exemplo, no caso de se tratar de um CEM, as caracteristicas poderão ser a velocidade do alvo ou da NPM, o ângulo de magnetização, a distância ao sensor, ou o tamanho do alvo por exemplo, ao passo que, tratando-se de um CFO, as caracteristicas em causa poderão estar relacionadas com a velocidade linear do alvo no canal, o tamanho do alvo ou a densidade do seu conteúdo. Depois de caracterizados, o classificador avaliador (58) usando essa informação e a sequência temporal em si, decide se os impulsos são originados a partir de partículas marcantes associadas a alvos biológicos ou de aglomerados de partículas livres.

O classificador permite detetar de uma forma eficaz e inteligente, sinais não periódicos produzidos pelo citómetro, o que permite que a identificação de partículas marcantes associadas a alvos biológicos seja mais precisa e que diagnósticos baseados nessa análise sejam mais corretos, produzindo taxas de falsos positivos reduzidas em comparação com outros métodos de deteção utilizados. Tal é conseguido uma vez que a inteligência que o classificador possui permite que sejam atingidos dois propósitos fundamentais para uma deteção precisa: 1) conseguir identificar um padrão num sinal ruidoso, padrão esse que, normalmente, é da família gaussiana e 2) destrinçar o sinal produzido por uma partícula marcante associada a alvos biológicos do sinal produzido por um aglomerado de partículas, não associadas a alvos biológicos.

A implementação do classificador da presente invenção poderá envolver um estágio inicial de pré-seleção de sequências temporais, extraídas de informação em bruto, através de um método de limiares. Os candidatos são filtrados por um filtro de banda adaptada e sendo posteriormente avaliados pelo classificador. Alternativamente, aos dados em bruto é aplicada uma janela deslizante, que serve de entrada direta para o classificador sem qualquer pré-seleção.

Para implementar o classificador são implementados também vários métodos regressores que permitem extrair de cada sequência temporal (51), informações adicionais que podem servir de entrada ao próprio classificador, tais como: distância vertical do alvo ao sensor (CEM), ângulo de magnetização (CEM), e velocidade linear do alvo no canal (CEM ou CFO), tamanho do alvo (CEM ou CFO), etc. 0 alvo ou padrão a ser encontrado pela ação do classificador são impulsos gaussianos, normalmente bipolares no caso da CEM ou monopolares no caso da CFO, similares aos ilustrado na Figura 3. Considera-se um impulso uma sequência no tempo, discreta ou contínua, com apenas um ciclo, de duração limitada, durante a qual existe um máximo ou um mínimo no caso monopolar, ou um máximo e um mínimo na mesma ordem absoluta de intensidade no caso bipolar.

Para tal, a inteligência do classificador é atribuída pelo recurso a duas técnicas de aprendizagem automática - redes neuronais artificiais (RNA) (2), e máquina de vetores de suporte (MVS) (4) - que operam de forma combinada. Neste contexto, a MVS (4) é utilizada como um método auxiliar de classificação, servindo a sua saída como entrada da RNA (2). No entanto, a MVS (4) também pode ser utilizada independentemente para classificar os impulsos. Para treinar (56) quer a RNA (2) quer a MVS (4), é necessário ter um conjunto de treino (54, 55) etiquetado de forma a se poder realizar uma aprendizagem supervisionada.

Etapa de treino - Simulação e Criação de dados de treino

O conjunto de treino (54, 55) e de testes é baseado em simulações digitais de aquisição de sinal, que modelam a interação entre as partículas marcantes e os sensores (transdutores), de forma a que esta resulte em uma sequência temporal de amostras com diferentes valores numéricos. Este tipo de simulações, ao ser utilizado para treinar (56) os mecanismos de aprendizagem automática, permite obter resultados bastante precisos, trazendo vantagens em relação à utilização de sinais reais, nomeadamente o facto de a origem dos sinais simulados ser conhecida e descrita, o que permite criar etiquetas fundamentais para a aprendizagem automática .

A interação entre partículas marcantes e sensores é modelada em função da técnica de Citometria em utilização. Por exemplo, tratando-se de um CEM, os impulsos que o classificador pretende detetar, podem ser aproximados pela integração do campo de um dipolo na área dos sensores.

Nesse sentido, a equação (1) descreve a interação de um dipolo magnético com um sensor de área wxl (w - largura, 1 - comprimento) onde x e y são a posição do dipolo nos eixos x e y, em relação ao centro do sensor e paralelos ao mesmo, h é a posição no eixo perpendicular ao plano do sensor, M é a magnetização da NPM, e Teta (Q) o ângulo de magnetização da NPM. Esta equação é então a base para todas as simulações (CEM). Fixando y, h e Q, e varrendo x para uma série de valores podemos obter o sinal bipolar resultante da interação da partícula. Para obter um conjunto de treino (54, 55) para aprendizagem automática, para cada varrimento de x, h e Q tomam um valor diferente de um conjunto de valores pré- selecionados de acordo com os parâmetros do processo num citómetro, resultando num banco de impulsos bipolares. A altura (h) é limitada pela altura do canal e Q é determinado pela velocidade de rotação do alvo que se desloca no fluido e pelo ângulo do campo magnético de excitação.

0 conjunto de sinais resultantes das simulações digitais representa sequências temporais de amostras sem ruído, o que faz com que não represente o caso real que é extraído de um citómetro. Para que o conjunto de treino (54, 55) contenha casos que possam ser similares à realidade, e que garantam, portanto, que a aprendizagem no treino (56) se traduz para a realidade, é necessário realizar 3 passos de expansão: amostragem, adição de ruído e geração de um conjunto de não-impulsos.

No passo de amostragem, o sinal contínuo (a simulação é discreta, mas pode ser simulado qualquer ponto) é reamostrado com diferente número de amostras, adicionando assim o fator tempo/velocidade à simulação e emulando o processo de amostragem que acontece no citómetro. Para uma versão computacionalmente menos exigente, é possível fazer esta amostragem baseada em valores interpolados da simulação original, em vez de simular todos os pontos.

Na adição de ruído, ruído com características similares ao resultante do citómetro é adicionado a cada uma das sequências temporais. Para aumentar a robustez do classificador, ruído de diferentes potências é somado a cada impulso. É também necessário um processo de repetição do ruído que consiste em adicionar ao mesmo impulso vários conjuntos de amostras aleatórias de ruído com a mesma potência, gerando várias versões do impulso ruidoso. Isto é necessário porque o ruído é um fenómeno aleatório, e é desejável que o classificador fique insensível ao mesmo e não que decore um caso específico de impulso com ruído.

Criando A - diferentes amostragens, N - potências de ruído, e R - repetições, para cada S - simulação, o conjunto de treino resultante tem AxNxRxS elementos. Este número pode facilmente chegar a centenas de milhares, partindo apenas de algumas dezenas de simulações comportamentais .

0 banco de dados com impulsos amostrados e com ruído de várias potências é o que será apresentado ao classificador como a etiqueta que representa os impulsos que é desejável quantificar. No entanto, para que o classificador aprenda a destrinçar um impulso desejável - produzido por uma partícula marcante - de tudo o resto, é também necessário fornecer uma quantidade similar de sinais a desprezar, designados por não-impulsos. Esse banco de dados é criado por se gerar ruído e eventos similares a interferências. As sequências temporais de apenas ruído são criadas gerando conjuntos de amostras aleatórias com desvios padrões iguais ou similares ao ruído adicionado aos impulsos. As interferências são criadas gerando impulsos monopolares, positivos ou negativos, de diferentes intensidades e durações em posições diferentes ao longo de uma janela de observação aos quais é adicionado ruído.

Rede Neuronal - Arquitetura

Uma estrutura de implementação preferível do classificador e dos métodos regressores, usando redes neuronais artificiais, recorre a I entradas, em que I resulta na soma do número de amostras (N) numa sequência temporal ao número de características (F) extraídas dessa mesma sequência temporal, por um algoritmo de extração de características (6), bem como a saída de regressores (OR)(5) ou da MVS (OS) (4) que sejam simultaneamente aplicados, I = N+(F+OR+OS). Podem ser utilizadas H camadas escondidas que estão relacionadas com a complexidade do problema e tamanho do espaço de resultados a analisar, e O saídas que dependem do número de classes (O = log 2 [n Q de classes\ + 1, no caso de classificadores binários). Para os propósitos da presente invenção, foram comtempladas 4 classes: impulso (classe 1), não-impulso (classe 2), impulso - partícula marcante associada a alvo biológico (classe 1-1) e impulso aglomerados (classe 1-2). Apesar de o classificador ter 2 saídas, na prática estas são o resultado de duas fases sequenciais: deteção de impulso (2 classes) e avaliação do impulso (2 classes). Como tal, foi necessário desenvolver dois classificadores que trabalham em sequência. O primeiro classificador, ou classificador detetor (53), está adaptado a identificar um impulso (classe 1) e um não-impulso (classe 2). O segundo classificador, ou classificador avaliador (58), está adaptado a destrinçar, de entre os impulsos detetados pelo primeiro classificador, o tipo de impulso, isto é, se se trata de uma partícula marcante associada a alvo biológico (classe 1-1) ou se de um aglomerado (classe 1-2).

Quer para a tarefa de deteção de impulsos, quer para a tarefa de avaliação de impulsos, podem ser utilizados classificadores do tipo independente (20) ou composto (10), sendo que o tipo de classificador é determinado pelos recursos disponíveis (tempo e hardware) e a diferença de função é determinada apenas pelo conjunto de treino (54, 55) a que são submetidos. Para deteção de impulsos o classificador detetor (53) é treinado (56) com um conjunto de treino (54) composto por exemplos de impulsos desejáveis (classe 1) e por ruído e interferências, e/ou não-impulsos (classe 2). Para a avaliação de impulsos o classificador avaliador (58) é treinado com um conjunto de treino (55) que compreende exemplos de impulsos de partícula marcante associada a alvo biológico (classe 1-1) ou impulsos de aglomerado (classe 1-2).

Classificador independente (20) ou composto (10)

Para a determinação das classes os classificadores (53, 58) poderão ser um de dois tipos: independente (20) ou composto (10).

Num classificador independente (20), as sequências temporais com N amostras são usadas como I entradas e a classificação é apenas baseada nessa informação. Para obter um número de amostras desejável recorre-se por exemplo a uma janela deslizante que percorre os dados experimentais gradualmente seccionando as N amostras que servem de entrada ao classificador (I = N).

A carga computacional associada a um classificador do tipo independente (20) é mais leve do que o classificador do tipo composto (10), principalmente porque não necessita da extração de características.

Por outro lado, se se optar por um classificador do tipo composto (10), as entradas da rede neuronal I são as N amostras da sequência temporal, as F características extraídas que podem ser operações matemáticas simples sobre os valores das amostras, bem como as saídas dos regressores (OR) ou da MVS (OS), o que acarreta computação adicional (I=N+F+OR+OS) .

Os regressores (5) utilizados são criados para estimar as variáveis utilizadas na simulação digital como posição no canal e a velocidade linear, tamanho do alvo (conhecendo a frequência de amostragem), entre outras. A adição desta informação ajuda no aumento da precisão da classificação, mas obviamente exige mais tempo e recursos de hardware. Os regressores (5) são treinados com um banco de impulsos, de forma a que os valores das variáveis usadas na simulação de cada caso de treino - número de partículas marcantes, distância ao sensor, velocidade, etc. - sejam corretamente inferidos na saída da RNA (2), no final do treino. Cada regressor (5) pode ser dedicado a uma variável de simulação ou um único regressor (5) poderá ter V saídas, igual ao número de variáveis de simulação a inferir. A RNA (2) vai ser treinada de forma a minimizar o erro entre o valor da variável que foi utilizado para simular o impulso, e a saída da própria RNA (2). Depois do treino, o banco de regressores (5) quando submetido a um impulso, deve produzir como saídas todos os valores das variáveis de simulação que produziriam um impulso igual ao analisado.

0 algoritmo de extração de características (6) utilizado retira informações da sequência temporal como, mas não limitado a: o máximo, o mínimo, o número de amostras entre o máximo e o mínimo, a largura do máximo ou mínimo para um determinado valor de proeminência, o máximo do integral cumulativo de todos os valores, a largura do integral cumulativo para um determinado valor de proeminência, etc. Métodos automáticos de extração de características como auto-encoders ou análise de componentes principais, etc., podem ser usados para esta extração.

A MVS (4) é treinada por analisar as características extraídas dos exemplos no mesmo banco de dados utilizado para o treino da RNA (2).

Pré-Processamento

Os classificadores (53, 58) podem ser precedidos de uma etapa de pré-processamento (52) por limiares e filtragem adaptada de banda plana e atraso de fase linear, dependendo dos recursos e tempo disponível.

Este pré-processamento (52) considera limiares de amplitude e número de amostras, e verifica o respetivo rácio entre valores máximos e mínimos (no caso de impulsos bipolares) . Neste caso, todas as sequências temporais, onde pelo menos dentro de X (X £ N) amostras, determinado pela velocidade do fluxo, existe um máximo e/ou um mínimo maior em valor absoluto do que um limiar - escolhido como um múltiplo do valor eficaz do ruído, medido nas primeiras amostras do sinal em bruto -, e, no caso de impulsos bipolares cujo rácio R, entre o máximo e o mínimo, esteja dentro de limites arbitrados, são consideradas candidatas a impulsos.

Para que a deteção utilizando limiares seja mais precisa recorre-se a uma medição pseudo-diferencial, na qual se subtrai ao sinal do sensor a ser medido o sinal de um sensor de referência. Visto que os sensores têm valores de resistência base diferentes, resultantes do seu processo de fabricação - podem atingir valores de +/- 10% -, e também diferentes correntes de polarização resultantes da desadaptação das fontes de corrente, os sinais têm diferenças que é necessário compensar. Para obter esta compensação, uma estimação desta diferença é realizada para determinar o fator multiplicador que necessita de ser aplicado de forma a que da subtração dos dois sinais resulte a menor potência de ruído. Este fator é aplicado ao sinal do sensor de referência e este é subtraído ao sinal do sensor a ser medido. Esta subtração permite remover ou mitigar algumas das interferências comuns a ambos os sensores. Também permite que os limiares utilizados sejam de amplitude mais baixa. O ruído utilizado para estas verificações é calculado com base nas primeiras amostras do teste onde ainda não há presença de partículas.

Posteriormente para facilitar a etapa de avaliação, cada candidato é filtrado através de um filtro adaptado de banda plana e atraso de fase linear. Com este filtro, consegue-se diminuir ao máximo a banda de integração do ruído, para que o possível impulso seja o mais similar à simulação. Este é um filtro digital cuja banda de passagem é adaptada para conter uma determinada percentagem da energia contida naquela sequência temporal. Para determinar a energia é efetuada uma análise espectral usando o método de médias por estimadores segmentados de Welch, ou outro método similar.

0 filtro proposto, além de melhorar a relação sinal-ruído por reduzir a banda de integração ao mínimo, é mais apropriado a esta tarefa de avaliação, porque o primeiro classificador é treinado com sinais deformados apenas por ruído, e não por efeitos indesejados do canal (ex. não linearidades do filtro). Com o uso deste filtro de banda de passagem plana, o impulso é deformando o mínimo possível, ao contrário do que acontece com o recurso ao filtro adaptado (matched filter) comum, que tem ainda a desvantagem de a sua interação com um impulso quadrado ou similar, causado por exemplo por interferências, resultar num artefacto muito similar ao sinal de uma partícula marcante associada a alvo biológico, o que causa o aparecimento de padrões que levariam à contagem de falsos positivos.

Apesar de aparentemente mais complexo, o pré- processamento (52) requer, em média, menos recursos computacionais do que o exigido na aplicação de vários filtros adaptados, visto que apenas o primeiro filtro passa- banda é aplicado a todo o sinal, que tem biliões de amostras temporais. Os filtros de banda adaptada propostos são apenas aplicados a poucas centenas de sequências temporais, dependendo do número de eventos/partículas na amostra e do limiar escolhido, contendo, por isso, poucos milhares de pontos.

Primeiro classificador (classificador detetor) O classificador detetor (53) pode ser do tipo composto (10) ou independente (20), dependendo do nível de performance necessário ou possível tendo em conta restrições temporais e de hardware.

O classificador detetor (53) usado nesta tarefa deve ser treinado (56) com um conjunto de treino (54) composto por exemplos de impulsos desejáveis (classe 1) e por ruído e interferências (classe 2). Depois de treinado (56) o classificador detetor (53), os dados podem ser classificados. Para tal, são selecionados pela janela deslizante e inseridos no classificador detetor (53), passando ou não pela etapa de pré-processamento (52). Depois da classificação, os dados são classificados em impulsos (classe 1) e guardados ou não-impulsos (classe 2) e descartados .

Segundo classificador (classificador avaliador)

O classificador avaliador (58) pode ser do tipo composto (10) ou independente (20), dependendo do nível de performance necessário ou possível tendo em conta restrições temporais e de hardware.

Depois da classificação como não-impulso ou impulso pelo classificador detetor (53), as sequências temporais identificadas como impulso são guardadas e submetidas a uma nova ronda de classificação, através do classificador avaliador (58), que se encontra treinado (56) para distinguir entre aglomerado e partícula marcante associada a alvo biológico. Este classificador avaliador (58) é treinado (56) com um conjunto de treino (55) composto, por exemplos, de impulsos gerados quer por partículas marcantes associadas a alvos biológicos (classe 1-1) quer por aglomerados de partículas (classe 1-2). Depois de treinado (56) o classificador avaliador (58), os dados podem ser avaliados. Para tal, são selecionados pela janela deslizante e inseridos no classificador avaliador (58), passando ou não pela etapa de pré-processamento (52), terminando no evento de deteção (59), sendo cada um dos dados classificado como partícula marcante associada a alvo biológico (classe 1-1) e guardado ou classificado como aglomerado (classe 1-2) e descartado na etapa de eliminação (57).

Distinção de aglomerados

O propósito do classificador avaliador (58) é o de distinguir entre impulsos gerados por partículas marcantes associadas a alvos biológicos e impulsos gerados apenas por aglomerados. Na figura 6 ilustra-se um exemplo do sinal gerado pelo mesmo número de partículas, quando estão aglomeradas em si mesmas, sinal gerado por aglomerado (61), ou quando marcam um alvo biológico, sinal gerado por partícula marcante associada a alvo biológico (62). É possível ver que as ondas partilham a duração, mas a amplitude é menor no caso da partícula marcante associada a um alvo biológico. A diminuição da amplitude prende-se com o facto de, no complexo alvo biológico/partículas marcantes, mais partículas estarem a uma distância maior do sensor, particularmente no eixo perpendicular ao plano do sensor quando comparado com o aglomerado de partículas.

Desta forma, o classificador avaliador (58) é treinado (56) com um conjunto de treino (55) de simulação que contém sinais simulados de partículas marcantes associadas a alvos biológicos (classe 1-1) e de aglomerados (classe 1-2) e com etiquetas respetivas. Para tal, no caso do classificador independente (20), usa-se como entrada a sequência temporal que representa o impulso e no caso do classificador composto (10), usam-se adicionalmente as características da interação alvo/partícula extraídas pelos regressores como: distância ao sensor, velocidade, tamanho do alvo, etc., juntamente com as caraterísticas do sinal mencionadas anteriormente: o máximo, o mínimo, o número de amostras entre o máximo e o mínimo, a largura do máximo ou mínimo para um determinado valor de proeminência, o máximo do integral cumulativo de todos os valores, a largura do integral cumulativo para um determinado valor de proeminência, etc. e também a saída da MVS.

As entradas especificadas podem ser usadas todas em simultâneo, independentemente, ou intercaladas como for mais conveniente para a aplicação. Ao contrário do classificador detetor (53), que distingue impulsos de ruído, em que uma das classes de treino é composta por impulsos e a outra por ruído e interferências, para o classificador avaliador (58) o conjunto de treino é apenas composto por impulsos de origens diferentes, o que permite especializar- se apenas nesta distinção.

Processamento de sinal clássico

0 classificador desenvolvido pode ser aplicado em conjunção com métodos clássicos de processamento de sinal, como filtros em hardware ou software junto com heurística. No entanto, a inteligência que possui conferida pelos algoritmos de aprendizagem automática que executa, viabiliza a aplicação do classificador diretamente ao sinal em bruto, saído do citómetro, sem etapas prévias de filtragem ou seleção.

Como será evidente a um perito na especialidade, a presente invenção não deverá estar limitada aos modos de realização descritos no presente documento, sendo possíveis diversas alterações que se mantêm no âmbito da presente invenção. Evidentemente, os modos preferenciais acima apresentados são combináveis, nas diferentes formas possíveis, evitando-se aqui a repetição de todas essas combinações.

REFERÊNCIAS

Chícharo, A., Martins, M., Barnsley, L. C., Taouallah, A., & Fernandes, J. (2018). "Enhanced magnetic microcytometer with 3D flow focusing for cell enumeration." doi:https://doi.org/10.1039/C8LC0048 6B.

Soares, R., Martins, V. C., Macedo, R., Cardoso, F. A., Martins, S. A., Caetano, D. M., Henriques, P., Silvério, V., Cardoso, S., Freitas, P. P. (2019). "Go with the flow: advances and trends in magnetic flow cytometry." Analytical and Bioanalytical Chemistry, 411(9), 1839-1862.

Huang, C., X, Z., Ying, D., & Hall, D. (2017). "A GMR-based magnetic flow cytometer using matched filtering". IEEE Sensors, p. 1-3.

Loureiro, J., Andrade, P. Z., Cardoso, S, Silva, C. L., Cabral, J. M., & Freitas, P. P. (2011). Magnetoresistive chip cytometer. Lab on a Chip, 2255-2261.

Lisboa, 16 de dezembro de 2020.