향상된 계층적 클러스터링 알고리즘을 이용하여 상호작용 네트워크로부터 복수개의 서브 네트워크들을 클러스터하는 방법 및 장치专利检索-聚类算法数学与统计专利检索查询-专利查询网

향상된 계층적 클러스터링 알고리즘을 이용하여 상호작용 네트워크로부터 복수개의 서브 네트워크들을 클러스터하는 방법 및 장치

阅读：497发布：2024-01-17

专利汇可以提供향상된 계층적 클러스터링 알고리즘을 이용하여 상호작용 네트워크로부터 복수개의 서브 네트워크들을 클러스터하는 방법 및 장치专利检索，专利查询，专利分析的服务。并且각각의클러스터와복수개의클러스터들중 나머지클러스터들사이의링크를계산하여복수개의클러스터들중 각각의클러스터에대한복수개의로컬힙들을구축하고, 복수개의클러스터들은복수개의서브네트워크들중 복수개의선택된서브네트워크들에대응하고, 복수개의클러스터들중 각각의클러스터및 복수개의로컬힙들중 각각의로컬힙의가장높은우선순위의클러스터사이의링크를계산하여글로벌힙을구축하고, 각각의로컬힙의가장높은우선순위의클러스터와글로벌힙의가장높은우선순위의클러스터를병합하여복수개의중간클러스터들을형성하고, 복수개의중간클러스터들중 각각의중간클러스터및 글로벌힙의각각의클러스터사이의링크를계산하고, 각각의클러스터는각각의로컬힙에대응하고, 각각의계산된유사도계수가기설정된링크기준치값 이하이면, 각각의중간클러스터를최종클러스터로반환하는,향상된계층적클러스터링알고리즘을이용하여상호작용네트워크로부터복수개의서브네트워크들을클러스터하는방법및 장치를개시한다.，下面是향상된 계층적 클러스터링 알고리즘을 이용하여 상호작용 네트워크로부터 복수개의 서브 네트워크들을 클러스터하는 방법 및 장치专利的具体信息内容。

权利要求

각각의 클러스터와 복수개의 클러스터들 중 나머지 클러스터들 사이의 링크를 계산하여 상기 복수개의 클러스터들 중 각각의 클러스터에 대한 복수개의 로컬 힙들을 구축하는 단계로서, 상기 복수개의 클러스터들은 복수개의 서브 네트워크들 중 복수개의 선택된 서브 네트워크들에 대응하는 단계;
상기 복수개의 클러스터들 중 각각의 클러스터 및 복수개의 로컬 힙들 중 각각의 로컬 힙의 가장 높은 우선순위의 클러스터 사이의 링크를 계산하여 글로벌 힙을 구축하는 단계;
상기 각각의 로컬 힙의 상기 가장 높은 우선순위의 클러스터와 상기 글로벌 힙의 가장 높은 우선순위의 클러스터를 병합하여 복수개의 중간 클러스터들을 형성하는 단계;
상기 복수개의 중간 클러스터들 중 각각의 중간 클러스터 및 상기 글로벌 힙의 각각의 클러스터 사이의 링크를 계산하는 단계로서, 각각의 클러스터는 상기 각각의 로컬 힙에 대응하는 단계; 및
각각의 계산된 유사도 계수가 기설정된 링크 기준치 값 이하이면, 상기 각각의 중간 클러스터를 최종 클러스터로 반환하는 단계를 포함하는,
향상된 계층적 클러스터링 알고리즘을 이용하여 상호작용 네트워크로부터 복수개의 서브 네트워크들을 클러스터하는 방법.

제 1항에 있어서,
상기 링크의 값은 기능적 관계 정량자(functional relationship quantifier)를 계산하기 위해 사용되는 사용자 정의 맞춤형 유사도 계수를 기초로 하는, 향상된 계층적 클러스터링 알고리즘을 이용하여 상호작용 네트워크로부터 복수개의 서브 네트워크들을 클러스터하는 방법

제 1항에 있어서,
상기 계산된 링크가 상기 기설정된 링크 기준치 값 이상이면, 상기 글로벌 힙 안에 상기 각각의 중간 클러스터를 삽입하는 단계를 더 포함하는, 향상된 계층적 클러스터링 알고리즘을 이용하여 상호작용 네트워크로부터 복수개의 서브 네트워크들을 클러스터하는 방법.

제 1항에 있어서,
상기 로컬 힙을 구축하는 단계는,
상기 클러스터에 대해 계산된 링크가 기설정된 링크 기준치 값 이상이면 상기 각각의 로컬 힙에 상기 나머지 클러스터들의 각각의 클러스터를 더해서 상기 각각의 클러스터에 대한 상기 로컬 힙을 구축하는, 향상된 계층적 클러스터링 알고리즘을 이용하여 상호작용 네트워크로부터 복수개의 서브 네트워크들을 클러스터하는 방법.

제 1항에 있어서,
상기 병합하는 단계는,
상기 각각의 로컬 힙 안의 상기 적어도 하나의 클러스터와 상기 글로벌 힙 안의 상기 적어도 하나의 클러스터에 대한 상기 계산된 링크의 값을 기초로 하여,
상기 각각의 로컬 힙의 적어도 하나의 클러스터와 상기 글로벌 힙의 적어도 하나의 클러스터의 우선순위를 정하여 상기 각각의 로컬 힙의 상기 가장 높은 우선순위의 클러스터와 상기 글로벌 힙의 상기 가장 높은 우선순위의 클러스터를 결정하는 단계를 포함하는, 향상된 계층적 클러스터링 알고리즘을 이용하여 상호작용 네트워크로부터 복수개의 서브 네트워크들을 클러스터하는 방법.

제 1항에 있어서,
복수의 환자들 중 각각의 환자에 대한 복수개의 서브 네트워크들을 생성하는 단계;
맞춤형 유사도 계수를 기초로 한 상기 향상된 계층적 클러스터링 알고리즘을 사용하여 상기 각각의 환자들의 상기 복수개의 서브 네트워크들 내에서 서브 네트워크들을 클러스터하는 단계; 및
상기 복수의 환자들에 대한 클러스터들을 모아서 클러스터들의 데이터 셋을 생성하는 단계를 더 포함하는, 향상된 계층적 클러스터링 알고리즘을 이용하여 상호작용 네트워크로부터 복수개의 서브 네트워크들을 클러스터하는 방법.

제 6항에 있어서,
클러스터들의 데이터 셋으로부터 복수개의 관심 클러스터들을 초기화하는 단계;
상기 클러스터들의 데이터 셋을 이용하여 상기 관심 클러스터들을 성장시키는 단계;
각각의 환자에 대해 클러스터된 서브 네트워크들을 기초로 하여 복수개의 각 관심 영역안의 각각의 환자들의 멤버쉽을 결정하는 단계; 및
상기 각각의 환자들의 결정된 멤버쉽을 기초로 하여 복수개의 그룹들 중 하나의 그룹으로 상기 복수의 환자들을 그룹핑하고 상기 그룹의 환자들은 동일한 클러스터 멤버쉽을 가지는 단계를 더 포함하는,
향상된 계층적 클러스터링 알고리즘을 이용하여 상호작용 네트워크로부터 복수개의 서브 네트워크들을 클러스터하는 방법.

제 6항에 있어서,
차별적 마커 발발현에 기초하여 복수개의 시드 마커들 주변에 복수개의 첫번째 레벨 서브 네트워크를 생성하는 단계;
기설정된 기록 함수(scoring function)를 기초로 하여 상기 생성된 첫번째 레벨 서브 네트워크들을 성장시키는 단계; 및
상기 향상된 클러스터링 알고리즘 및 상기 기설정된 기록 함수 중 하나를 기초로 하여 상기 성장된 첫번째 레벨 서브 네트워크들을 병합하여 복수개의 서브 네트워크들을 생성하는 단계를 더 포함하는, 향상된 계층적 클러스터링 알고리즘을 이용하여 상호작용 네트워크로부터 복수개의 서브 네트워크들을 클러스터하는 방법.

제 6항에 있어서,
질병 특이적 입력 마커 유전자들의 불완전한 셋으로부터 생성된 서브 네트워크들을 상기 맞춤형 유사도 계수를 기초로 클러스터하여 적어도 하나의 바이오 마커를 도출하는 단계를 더 포함하는, 향상된 계층적 클러스터링 알고리즘을 이용하여 상호작용 네트워크로부터 복수개의 서브 네트워크들을 클러스터하는 방법.

각각의 클러스터와 복수개의 클러스터들 중 나머지 클러스터들 사이의 링크를 계산하여 상기 복수개의 클러스터들 중 각각의 클러스터에 대한 복수개의 로컬 힙들을 구축하고, 상기 복수개의 클러스터들은 복수개의 서브 네트워크들 중 복수개의 선택된 서브 네트워크들에 대응하고,
상기 복수개의 클러스터들 중 각각의 클러스터 및 복수개의 로컬 힙들 중 각각의 로컬 힙의 가장 높은 우선순위의 클러스터 사이의 링크를 계산하여 글로벌 힙을 구축하고,

상기 각각의 로컬 힙의 상기 가장 높은 우선순위의 클러스터와 상기 글로벌 힙의 가장 높은 우선순위의 클러스터를 병합하여 복수개의 중간 클러스터들을 형성하고,
각각의 계산된 유사도 계수가 기설정된 링크 기준치 값 이하이면, 상기 각각의 중간 클러스터를 최종 클러스터로 반환하는 제어부; 및
상기 복수개의 중간 클러스터들 중 각각의 중간 클러스터 및 상기 글로벌 힙의 각각의 클러스터 사이의 링크를 계산하고, 각각의 클러스터는 상기 각각의 로컬 힙에 대응하는 연산부를 포함하는
향상된 계층적 클러스터링 알고리즘을 이용하여 상호작용 네트워크로부터 복수개의 서브 네트워크들을 클러스터하는 장치.

제 10항에 있어서,
상기 제어부는,
상기 링크의 값은 기능적 관계 정량자(functional relationship quantifier)를 계산하기 위해 사용되는 사용자 정의 맞춤형 유사도 계수를 기초로 하는, 향상된 계층적 클러스터링 알고리즘을 이용하여 상호작용 네트워크로부터 복수개의 서브 네트워크들을 클러스터하는 장치

제 10항에 있어서,
상기 제어부는,
상기 계산된 링크가 상기 기설정된 링크 기준치 값 이상이면, 상기 글로벌 힙 안에 상기 각각의 중간 클러스터를 삽입하는, 향상된 계층적 클러스터링 알고리즘을 이용하여 상호작용 네트워크로부터 복수개의 서브 네트워크들을 클러스터하는 장치.

제 10항에 있어서,
상기 제어부는,
상기 클러스터에 대해 계산된 링크가 기설정된 링크 기준치 값 이상이면 상기 각각의 로컬 힙에 나머지 클러스터들의 각각의 클러스터를 더해서 상기 각각의 클러스터에 대한 상기 로컬 힙을 구축하는, 향상된 계층적 클러스터링 알고리즘을 이용하여 상호작용 네트워크로부터 복수개의 서브 네트워크들을 클러스터하는 장치.

제 10항에 있어서,
상기 제어부는,
상기 각각의 로컬 힙 안의 상기 적어도 하나의 클러스터와 상기 글로벌 힙 안의 상기 적어도 하나의 클러스터에 대한 상기 계산된 링크의 값을 기초로 하여, 상기 각각의 로컬 힙의 적어도 하나의 클러스터와 상기 글로벌 힙의 적어도 하나의 클러스터의 우선순위를 정하여 상기 각각의 로컬 힙의 상기 가장 높은 우선순위의 클러스터와 상기 글로벌 힙의 상기 가장 높은 우선순위의 클러스터를 결정하는, 향상된 계층적 클러스터링 알고리즘을 이용하여 상호작용 네트워크로부터 복수개의 서브 네트워크들을 클러스터하는 장치.

제 10항에 있어서,
상기 제어부는,
복수의 환자들 중 각각의 환자에 대한 복수개의 서브 네트워크들을 생성하고,
맞춤형 유사도 계수를 기초로 한 상기 향상된 계층적 클러스터링 알고리즘을 사용하여 상기 각각의 환자들의 상기 복수개의 서브 네트워크들 내에서 서브 네트워크들을 클러스터하고, 상기 복수의 환자들에 대한 클러스터들을 모아서 클러스터들의 데이터 셋을 생성하는, 향상된 계층적 클러스터링 알고리즘을 이용하여 상호작용 네트워크로부터 복수개의 서브 네트워크들을 클러스터하는 장치.

제 15항에 있어서,
상기 제어부는,
클러스터들의 데이터 셋으로부터 복수개의 관심 클러스터들을 초기화하고, 상기 클러스터들의 데이터 셋을 이용하여 상기 관심 클러스터들을 성장시키고, 각각의 환자에 대해 클러스터된 서브 네트워크들을 기초로 하여 복수개의 각 관심 영역안의 각각의 환자들의 멤버쉽을 결정하고, 상기 각각의 환자들의 결정된 멤버쉽을 기초로 하여 복수개의 그룹들 중 하나의 그룹으로 상기 복수의 환자들을 그룹화하고, 상기 그룹의 환자들은 동일한 클러스터 멤버쉽을 가지는, 향상된 계층적 클러스터링 알고리즘을 이용하여 상호작용 네트워크로부터 복수개의 서브 네트워크들을 클러스터하는 장치.

제 16항에 있어서,
상기 제어부는,
차별적 마커 발발현에 기초하여 복수개의 시드 마커들 주변에 복수개의 첫번째 레벨 서브 네트워크를 생성하고, 기설정된 기록 함수(scoring function)를 기초로 하여 상기 생성된 첫번째 레벨 서브 네트워크들을 성장시키고, 상기 향상된 클러스터링 알고리즘 및 상기 기설정된 기록 함수 중 하나를 기초로 하여 상기 성장된 첫번째 레벨 서브 네트워크들을 병합하여 복수개의 서브 네트워크들을 생성하는, 향상된 계층적 클러스터링 알고리즘을 이용하여 상호작용 네트워크로부터 복수개의 서브 네트워크들을 클러스터하는 장치.

제 15항에 있어서,
상기 제어부는,
질병 특이적 입력 마커 유전자들의 불완전한 셋으로부터 생성된 서브 네트워크들을 상기 맞춤형 유사도 계수를 기초로 클러스터하여 적어도 하나의 바이오 마커를 도출하는, 향상된 계층적 클러스터링 알고리즘을 이용하여 상호작용 네트워크로부터 복수개의 서브 네트워크들을 클러스터하는 장치.

하드웨어와 결합되어 제1항 내지 제 9항 중 어느 한 항의 방법을 실행시키기 위하여 매체에 저장된 컴퓨터 프로그램.

说明书全文

향상된 계층적 클러스터링 알고리즘을 이용하여 상호작용 네트워크로부터 복수개의 서브 네트워크들을 클러스터하는 방법 및 장치{THE METHOD AND APPARATUS FOR CLUSTERING A PLURALITY OF SUB-NETWORKS OF AN INTERACTION NETWORK USING AN ENHANCED HIERARCHICAL CLUSTERING ALGORITHM}

향상된 계층적 클러스터링 알고리즘을 이용하여 상호작용 네트워크로부터 복수개의 서브 네트워크들을 클러스터하는 방법 및 장치에 관한다.

의료 과학, 생물 정보학, 생명 공학의 최근 발전은 엄청난 양의 생물학적 데이터(예를 들면, 유전자 발현 데이터)를 축적하게 되었다. 이 대용량 데이터의 분석 및 해석은 어려운 작업이다. 또한, 마이크로 어레이 및 차세대 생명공학적 방법의 출현으로, 대량의 유전자 발현 데이터의 사용은 생물학 연구에서 편재되고있다. 예를 들어, 대량의 유전자 발현 데이터는 유전자 양방향 네트워크 또는 단백질 상호 작용 네트워크와 같은 다양한 생물학적 네트워크를 생성하는데 사용될 수 있다. 다양한 생물 정보학 연구들은 경로 또는 서브 - 네트워크와 같은 기능적으로 관련된 유전자들의 그룹 수준에서 유전자 발현 데이터를 분석하도록 제안한다.

향상된 계층적 클러스터링 알고리즘을 이용하여 상호작용 네트워크로부터 복수개의 서브 네트워크들을 클러스터하는 방법 및 장치에 관한다. 또한 상기 방법을 컴퓨터에서 실행시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록 매체를 제공한다. 해결하고자 하는 기술적 과제는 상기된 바와 같은 기술적 과제들로 한정되지 않으며, 또 다른 기술적 과제들이 존재할 수 있다.

일 측면에 따르면, 각각의 클러스터와 복수개의 클러스터들 중 나머지 클러스터들 사이의 링크를 계산하여 복수개의 클러스터들 중 각각의 클러스터에 대한 복수개의 로컬 힙들을 구축하는 단계로서, 복수개의 클러스터들은 복수개의 서브 네트워크들 중 복수개의 선택된 서브 네트워크들에 대응하는 단계, 복수개의 클러스터들 중 각각의 클러스터 및 복수개의 로컬 힙들 중 각각의 로컬 힙의 가장 높은 우선순위의 클러스터 사이의 링크를 계산하여 글로벌 힙을 구축하는 단계, 각각의 로컬 힙의 가장 높은 우선순위의 클러스터와 글로벌 힙의 가장 높은 우선순위의 클러스터를 병합하여 복수개의 중간 클러스터들을 형성하는 단계, 복수개의 중간 클러스터들 중 각각의 중간 클러스터 및 글로벌 힙의 각각의 클러스터 사이의 링크를 계산하는 단계로� ��, 각각의 클러스터는 각각의 로컬 힙에 대응하는 단계 및 각각의 계산된 유사도 계수가 기설정된 링크 기준치 값 이하이면, 각각의 중간 클러스터를 최종 클러스터로 반환하는 단계를 포함하는,향상된 계층적 클러스터링 알고리즘을 이용하여 상호작용 네트워크로부터 복수개의 서브 네트워크들을 클러스터하는 방법을 개시한다.

또한, 링크의 값은 기능적 관계 정량자(functional relationship quantifier)를 계산하기 위해 사용되는 사용자 정의 맞춤형 유사도 계수를 기초로 할 수 있다.

또한, 계산된 링크가 기설정된 링크 기준치 값 이상이면, 글로벌 힙 안에 각각의 중간 클러스터를 삽입하는 단계를 더 포함할 수 있다.

또한, 로컬 힙을 구축하는 단계는, 클러스터에 대해 계산된 링크가 기설정된 링크 기준치 값 이상이면 각각의 로컬 힙에 나머지 클러스터들의 각각의 클러스터를 더해서 각각의 클러스터에 대한 로컬 힙을 구축할 수 있다.

또한, 병합하는 단계는, 각각의 로컬 힙 안의 적어도 하나의 클러스터와 글로벌 힙 안의 적어도 하나의 클러스터에 대한 계산된 링크의 값을 기초로 하여, 각각의 로컬 힙의 적어도 하나의 클러스터와 글로벌 힙의 적어도 하나의 클러스터의 우선순위를 정하여 각각의 로컬 힙의 가장 높은 우선순위의 클러스터와 글로벌 힙의 가장 높은 우선순위의 클러스터를 결정하는 단계를 포함할 수 있다.

또한, 복수의 환자들 중 각각의 환자에 대한 복수개의 서브 네트워크들을 생성하는 단계, 맞춤형 유사도 계수를 기초로 한 향상된 계층적 클러스터링 알고리즘을 사용하여 각각의 환자들의 복수개의 서브 네트워크들 내에서 서브 네트워크들을 클러스터하는 단계 및 복수의 환자들에 대한 클러스터들을 모아서 클러스터들의 데이터 셋을 생성하는 단계를 더 포함할 수 있다.

또한, 클러스터들의 데이터 셋으로부터 복수개의 관심 클러스터들을 초기화하는 단계, 클러스터들의 데이터 셋을 이용하여 관심 클러스터들을 성장시키는 단계, 각각의 환자에 대해 클러스터된 서브 네트워크들을 기초로 하여 복수개의 각 관심 영역안의 각각의 환자들의 멤버쉽을 결정하는 단계 및 각각의 환자들의 결정된 멤버쉽을 기초로 하여 복수개의 그룹들 중 하나의 그룹으로 복수의 환자들을 그룹핑하고 그룹의 환자들은 동일한 클러스터 멤버쉽을 가지는 단계를 더 포함할 수 있다.

또한, 차별적 마커 발현에 기초하여 복수개의 시드 마커들 주변에 복수개의 첫번째 레벨 서브 네트워크를 생성하는 단계, 기설정된 기록 함수(scoring function)를 기초로 하여 생성된 첫번째 레벨 서브 네트워크들을 성장시키는 단계 및 향상된 클러스터링 알고리즘 및 기설정된 기록 함수 중 하나를 기초로 하여 성장된 첫번째 레벨 서브 네트워크들을 병합하여 복수개의 서브 네트워크들을 생성하는 단계를 더 포함할 수 있다.

또한, 질병 특이적 입력 마커 유전자들의 불완전한 셋으로부터 생성된 서브 네트워크들을 맞춤형 유사도 계수를 기초로 클러스터하여 적어도 하나의 바이오 마커를 도출하는 단계를 더 포함할 수 있다.

다른 일측면에 따르면, 각각의 클러스터와 복수개의 클러스터들 중 나머지 클러스터들 사이의 링크를 계산하여 복수개의 클러스터들 중 각각의 클러스터에 대한 복수개의 로컬 힙들을 구축하고, 복수개의 클러스터들은 복수개의 서브 네트워크들 중 복수개의 선택된 서브 네트워크들에 대응하고, 복수개의 클러스터들 중 각각의 클러스터 및 복수개의 로컬 힙들 중 각각의 로컬 힙의 가장 높은 우선순위의 클러스터 사이의 링크를 계산하여 글로벌 힙을 구축하고, 각각의 로컬 힙의 가장 높은 우선순위의 클러스터와 글로벌 힙의 가장 높은 우선순위의 클러스터를 병합하여 복수개의 중간 클러스터들을 형성하고, 각각의 계산된 유사도 계수가 기설정된 링크 기준치 값 이하이면, 각각의 중간 클러스터를 최종 클러스터로 반환하는 제어부; 및 복수개의 중간 클러스터들 중 각각의 중간 클러스터 및 글로벌 힙의 각각의 클러스터 사이의 링크를 계산하고, 각각의 클러스터는 각각의 로컬 힙에 대응하는 연산부를 포함하는 향상된 계층적 클러스터링 알고리즘을 이용하여 상호작용 네트워크로부터 복수개의 서브 네트워크들을 클러스터하는 장치를 개시한다.

또한, 제어부는, 링크의 값은 기능적 관계 정량자(functional relationship quantifier)를 계산하기 위해 사용되는 사용자 정의 맞춤형 유사도 계수를 기초로 할 수 있다.

또한, 제어부는, 계산된 링크가 기설정된 링크 기준치 값 이상이면, 글로벌 힙 안에 각각의 중간 클러스터를 삽입할 수 있다.

또한, 제어부는, 클러스터에 대해 계산된 링크가 기설정된 링크 기준치 값 이상이면 각각의 로컬 힙에 나머지 클러스터들의 각각의 클러스터를 더해서 각각의 클러스터에 대한 로컬 힙을 구축할 수 있다.

또한, 제어부는, 각각의 로컬 힙 안의 적어도 하나의 클러스터와 글로벌 힙 안의 적어도 하나의 클러스터에 대한 계산된 링크의 값을 기초로 하여, 각각의 로컬 힙의 적어도 하나의 클러스터와 글로벌 힙의 적어도 하나의 클러스터의 우선순위를 정하여 각각의 로컬 힙의 가장 높은 우선순위의 클러스터와 글로벌 힙의 가장 높은 우선순위의 클러스터를 결정할 수 있다.

또한, 제어부는, 복수의 환자들 중 각각의 환자에 대한 복수개의 서브 네트워크들을 생성하고, 맞춤형 유사도 계수를 기초로 한 향상된 계층적 클러스터링 알고리즘을 사용하여 각각의 환자들의 복수개의 서브 네트워크들 내에서 서브 네트워크들을 클러스터하고, 복수의 환자들에 대한 클러스터들을 모아서 클러스터들의 데이터 셋을 생성할 수 있다.

또한 제어부는, 클러스터들의 데이터 셋으로부터 복수개의 관심 클러스터들을 초기화하고, 클러스터들의 데이터 셋을 이용하여 관심 클러스터들을 성장시키고, 각각의 환자에 대해 클러스터된 서브 네트워크들을 기초로 하여 복수개의 각 관심 영역안의 각각의 환자들의 멤버쉽을 결정하고, 각각의 환자들의 결정된 멤버쉽을 기초로 하여 복수개의 그룹들 중 하나의 그룹으로 복수의 환자들을 그룹화하고, 그룹의 환자들은 동일한 클러스터 멤버쉽을 가질 수 있다.

또한, 제어부는, 차별적 마커 발현에 기초하여 복수개의 시드 마커들 주변에 복수개의 첫번째 레벨 서브 네트워크를 생성하고, 기설정된 기록 함수(scoring function)를 기초로 하여 생성된 첫번째 레벨 서브 네트워크들을 성장시키고, 향상된 클러스터링 알고리즘 및 기설정된 기록 함수 중 하나를 기초로 하여 성장된 첫번째 레벨 서브 네트워크들을 병합하여 복수개의 서브 네트워크들을 생성할 수 있다.

또한, 제어부는, 질병 특이적 입력 마커 유전자들의 불완전한 셋으로부터 생성된 서브 네트워크들을 맞춤형 유사도 계수를 기초로 클러스터하여 적어도 하나의 바이오 마커를 도출할 수 있다.

도1은 일 실시예에 따른, 복수개의 서브 네트워크들을 클러스터링 하는 향상된 계층적 클러스터링 알고리즘을 설명하기 위한 흐름도이다.
도 2a는 일 실시예에 따른 향상된 계층적 클러스터링 알고리즘에 기초하여 환자의 그룹핑을 설명하는 예시도이다.
도 2b는 일 실시예에 따른 향상된 클러스터링 알고리즘에 의해 생성된 환자 그룹핑의 실험 결과를 나타난 도면이다.
향상된 클러스터링도 3은 일 실시예에 따른 폐암 환자들의 샘플 모집단에 실시한 환자 계층화의 결과의 예시를 나타낸 도면이다.
도 4는 일 실시예에 따라 더 큰 유전자 양방향 네트워크로부터 서브 네트워크의 생성을 설명하는 흐름도이다.
도 5는 일 실시예에따라, 구별하여 발현된 마커들의 첫번째 레벨의 서브 네트워크의 생성을 기초로 한 발현을 설명하기 위한 흐름도이다.
도 6은 일 실시 예에 따라, 성장한 첫번째 레벨의 서브 네트워크들과 주변에서 가장 구별하여 발현된 유전자를 병합하여 만든 더 큰 서브 네트워크의 예시를 나타낸 도면이다.
도 7은 일 실시 예에 따라, 바이오 마커를 정교화하는 예를 설명하기 위한 흐름도이다.
도 8은 일 실시예에 따라, 향상된 계층적 클러스터링 알고리즘을 사용하여 더 큰 네트워크의 복수개의 서브 네트워크들을 클러스터하는 방법 및 시스템을 실행하는 컴퓨팅 환경을 나타낸 도면이다.

본 발명의 이점 및 특징, 그리고 그것들을 달성하는 방법은 첨부되는 도면과 함께 후술되어 있는 실시예들을 참조하면 명확해질 것이다. 그러나 본 발명은 이하에서 개시되는 실시예들에 한정되는 것이 아니라 서로 다른 다양한 형태로 구현될 수 있으며, 단지 본 실시예들은 본 발명의 개시가 완전하도록 하고, 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자에게 발명의 범주를 완전하게 알려주기 위해 제공되는 것이며, 본 발명은 청구항의 범주에 의해 정의될 뿐이다.

본 명세서에서 사용되는 용어에 대해 간략히 설명하고, 본 발명에 대해 구체적으로 설명하기로 한다.

본 발명에서 사용되는 용어는 본 발명에서의 기능을 고려하면서 가능한 현재 널리 사용되는 일반적인 용어들을 선택하였으나, 이는 당 분야에 종사하는 기술자의 의도 또는 판례, 새로운 기술의 출현 등에 따라 달라질 수 있다. 또한, 특정한 경우는 출원인이 임의로 선정한 용어도 있으며, 이 경우 해당되는 발명의 설명 부분에서 상세히 그 의미를 기재할 것이다. 따라서 본 발명에서 사용되는 용어는 단순한 용어의 명칭이 아닌, 그 용어가 가지는 의미와 본 발명의 전반에 걸친 내용을 토대로 정의되어야 한다.

명세서 전체에서 어떤 부분이 어떤 구성요소를 "포함"한다고 할 때, 이는 특별히 반대되는 기재가 없는 한 다른 구성요소를 제외하는 것이 아니라 다른 구성요소를 더 포함할 수 있음을 의미한다. 또한, 명세서에서 사용되는 "부"라는 용어는 소프트웨어, FPGA 또는 ASIC과 같은 하드웨어 구성요소를 의미하며, "부"는 어떤 역할들을 수행한다. 그렇지만 "부"는 소프트웨어 또는 하드웨어에 한정되는 의미는 아니다. "부"는 어드레싱할 수 있는 저장 매체에 있도록 구성될 수도 있고 하나 또는 그 이상의 프로세서들을 재생시키도록 구성될 수도 있다. 따라서, 일 예로서 "부"는 소프트웨어 구성요소들, 객체지향 소프트웨어 구성요소들, 클래스 구성요소들 및 태스크 구성요소들과 같은 구성요소들과, 프로세스들, 함수들, 속성들, 프로시저들, 서브루틴들, 프로그램 코드의 세그먼트들, 드라이버들, 펌웨어, 마이크로 코드, 회로, 데이터, 데이터베이스, 데이터 구조들, 테이블들, 어레이들 및 변수들을 포함한다. 구성요소들과 "부"들 안에서 제공되는 기능은 더 작은 수의 구성요소들 및 "부"들로 결합되거나 추가적인 구성요소들과 "부"들로 더 분리될 수 있다.

아래에서는 첨부한 도면을 참고하여 본 발명의 실시예에 대하여 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자가 용이하게 실시할 수 있도록 상세히 설명한다. 그리고 도면에서 본 발명을 명확하게 설명하기 위해서 설명과 관계없는 부분은 생략한다.

최적화된 서브 네트워크를 생성하는 방법에는 구간 보강 테스트(term enrichment test)와 기록 함수(scoring function)를 이용하여 시드들(초기 서브 네트워크)을 성장시키는 알고리즘을 기반으로 서브 네트워크를 생성할 수 있다. 일부 기존 서브 네트워크 생성 알고리즘은 몇몇 기설정된 인접 조건에 기초하여 생성 된 작은 크기의 서브 - 네트워크들을 병합하여 시드들을 성장시킨다. 기록 함수가 얻은 것이 없거나 시드 주위의 유전자가 인접 조건을 만족하지 못하는 상황들이 있다. 이러한 상황들에서 생성 된 서브 네트워크들의 크기는 매우 작다. 생성할 때, 매우 작은 서브 네트워크는 그들 사이에 원하는 특정한 유사성에 대해 어떤 의미를 가질 수 없는 복수개의 서브 네트워크들의 결과로 서브 네트워크 생성 처리를 종료한다.

데이터 마이닝 연구의 병렬적인 진행은 클러스터링, 흥미로운 패턴과 대용량 데이터베이스들안의 지식을 발굴하기 위한 패턴 분석과 같은 효율적이고 확장 가능한 방법들을 제공한다. 클러스터링 등의 데이터 마이닝 기술은 다양한 생물 정보학 및 건강 관리 애플리케이션을위한 유전자 발현 데이터의 효과적인 해석을 제공 할 수있다. 클러스터링은 적은 숫자의 비교적 동종의 그룹들 기의 소수로 관심 데이터를 분할한다. 클러스터링은 서브 네트워크 수준에서 유전자 발현 데이터의 분석에 효과적인 도구 중 하나 일 수있다.

계층 적 클러스터링 알고리즘은 이전에 설립된 시드 클러스터를 사용하여 연속적인 클러스터들을 결정하는 클러스터링 방식에 대한 인기있는 선택이다. 기존의 계층 적 클러스터링 알고리즘은 클러스터링을 기준으로 거리를 측정하여 사용한다. 거리 측정을 기반으로 하는 계층적 클러스터링 알고리즘은 더 나은 적용성과 대부분의 숫자 데이터에 대한 신뢰성있는 결과를 제공한다.

클러스터링 기준으로 거리 측정을 하는 대신 불 방식(Boolean) 및 범주 형 데이터 링크를 이용하는 또 다른 계층적 클러스터링 알고리즘이 있다. 링크는 데이터의 근처에 있는 관련 정보를 캡처한다. 링크들의 번호가 높을수록 비교된 데이터간의 유사도가 더 높다. 링크는 두 개의 데이터 항목 또는 비교되는 데이터 세트 사이에 존재하는 직접 링크들(직접적인 관계)을 의미한다. 기존의 방법은 비교되는 데이터 간의 간접 링크들을 고려하지 못한다. 따라서 클러스터링에 대한 엄격한 접근 방식을 유지한다. 그러나 분석된 데이터 간의 간접 관계에 상당한 가중치를 제공하는 경우에는 많은 생물 정보학, 의료 및 비 생물학적 응용들은 효과적인 분석을 제공한다. 그러나, 간접 관계에 제공되기 위해 필요한 가중치는 최종 애플리케이션에 따라 달라질 수 있다.

실시 예들은 본원 향상된 계층적 클러스터링 알고리즘을 사용하여 더 큰 네트워크 (네트워크)에서 서브 네트워크의 복수의 클러스터하는 방법 및 시스템을 달성한다. 향상된 클러스터링 알고리즘은 복수개의 서브 네트워크의 클러스터링은 사용자 정의된 맞춤형 유사도 계수를 제공한다. 사용자 정의는 데이터 계층화, 바이오 마커의 검출 등과 같은 특정의 최종 애플리케이션에 더 적합하도록 클러스터링 기준을 정의하는 유연성을 가능하게한다. 클러스터하는 방법은 단일 클러스터 내에 그룹화 될 데이터 항목들 (독립체들) 간의 유사도를 사용자가 미리 정의 할 수 있도록 하여 사용자 정의의 여러 레벨을 제공한다. 클러스터하는 방법은 또한, 유사도 계수의 관점에서 개체 간의 유사도를 계산하기위한 기능적인 관계 정량자를 선택하는 유연성을 또한 제공한다.

일 실시 예에서, 유사도 계수를 계산하기 위해 사용 된 다양한 기능적 관계 정량자를 포함하지만, 일반적인 인접 상호 작용 계수 (CNIC), 엣지 상호 작용 계수 (EIC) 및 표준 자카드 인덱스(ZACCARD INDEX)에 한정하지 않는다. EIC와 CNIC 기능적 관계 정량자도 도 1에서 나중에 설명한다.

이에 따라, 서브 네트워크들간의 정량화된 관계의 사용은 서브 네트워크들의 클러터를 하는 동안에 서브 네트워크들 사이의 간접적인 기능적 관계의 고려를 허용한다.

사용자 정의는 생물학적 및 비생물학적 분야에서 다양한 어플리케이션들을 위한 향상된 계층적 클러스터링 알고리즘을 적용할 수 있다.

실시 예들의 보다 나은 이해를 위해, 향상된 클러스터링 알고리즘과 그것의 어플리케이션을 적용한 예는 생물 정보학 분야에서의 케이스를 사용하고 제한되어 고려되지 않는다. 이 방법은 대규모 네트워크에서 데이터베이스 정보가 복수개의 서브 네트워크를 생성하는데 사용되는 다양한 분야에도 동일하게 적용 가능하다.

일 실시 예는, 생물 정보학 및 건강 관리 어플리케이션을 포함하지만, 바이오 마커의 검출 (검색), 환자 계층화, 개인화 요법, 약물 효능 예측, 유전 질환의 유전 적 유사성 분석과 같은 것에 한정되지 않는다.

이 방법은 차등적으로 발현된 네트워크 독립체들의 성장을 기반으로 발현된 서브 네트워크들을 생성한다. 네트워크는 네트워크의 독립체들 사이의 관계를 매핑을 가능케 하는 생물학적 네트워크, 소셜 네트워크 등일 수 있다. 예를 들면, 유전자들과 사람들은 생물학적 네트워크의 독립체들 및 각각의 소셜 네트워크가 될 수 있다. 이런 네트워크 내의 독립체들은 하나 이상의 다른 영역에서 서로 관련된다. 독립체들 간의 관계는 매핑될수 있고, 관계는 영향력있는 관계, 상호 작용하는 관계 또는 단순한 연결을 기반으로 하는 관계가 될 수 있다. 다양한 생물 정보학 및 건강 관리 어플리케이션에 대한 생물학적 네트워크들은 유전자 상호 작용 네트워크, 단백질-단백질 상호 작용 네트워크, 신진대사 경로들, 유전자 규제 네트워크들, 신호 경로들을 포함하지만 이에 제한되지 않는다. 일시적이거나 특정 유전자들의 발현 레벨에서, 유전자들의 발현의 비정상의 존재는 모두 살아있는 생물체들의 암과 같은 유전자 질환의 주요 원인중 하나이다.

비정상성은 각각의 유전자/마커에 대한 정상적인 케이스의 평균적 발현에 비해서 유전자또는 마커들의 과도한 발현 또는 미달한 발현을 참조한다. 질병들의 분석에서 주요한 역할을 하는 정상의(건강한) 살아있는 존재의 마커의 발현과 관계하는 차등적 마커 발현을 발현 변이성의 변화라고 한다. 차등적 마커 발현의 일 예는 유전자 발현과 관계있는 마이크로어레이 실험으로부터 파생된 메신저RNA(mRNA)의 양을 측정한 값이 될 수 있다.

따라서, 차등 발현된 마커들을 이용한 서브 네트워크들의 생성은 더 좋은 생물학적 통찰력을 제공할 수 있다. 이러한 서브 네트워크는 다양한 방법을 사용하여 생성 될 수있다.

일 실시 예에서, 복수의 서브 네트워크들은 향상된 클러스터링 알고리즘을 사용하여 얻어진다. 유사도 계수를 정의하는 유연성은 사용자가 간접적인 관계의 레벨(유사도)을 고려하여 정의하도록 할 수 있다. 따라서 정의된 간접적 관계의 레벨은 유전자 상호 작용 네트워크에 존재하는 작은 세계 효과에 가중치를 부여한다. 작은 세계 효과는 유전자 상호 작용 네트워크의 고차원 이웃들을 가지는 유전자 영향력을 측정한다. 고차원 이웃들이란, 유전자와 직접적인 관계는 없지만, 하나 또는 그 이상의 중간단계를 건너뛰면 닿을 수 있는 유전자들이다.

고차 이웃의 유전자가 갖는 영향력이 미미한 것으로 관찰되면, 서브 네트워크를 생성하는 동안 제거 될 수있다. 따라서, 맞춤형 유사도 계수는 복수개의 서브 네트워크를 형성하는 차등 적으로 발현된 유전자들을 클러스터하여 서브 네트워크들을 생성하는 동안 작은 세계 효과를 제어 가능하게 한다.

상세한 설명에서는, 향상된 계층적 클러스터링 알고리즘 및 클러스터링 알고리즘은 상호 교환 가능하도록 사용된다.

도1은 일 실시예에 따른, 복수개의 서브 네트워크들을 클러스터링 하는 향상된 계층적 클러스터링 알고리즘을 설명하기 위한 흐름도이다.

서브 네트워크들의 클러스터링은 단일 그룹안의 유사한 서브 네트워크들을 그룹핑하거나 계층화할 수 있게한다.

사용자 정의 유사도 계수는 클러스터 안의 서브 네트워크들 간에서 원하는 유사도를 정의할 수 있게한다.

하나 또는 그이상의 클러스터들의 서브 네트워크를 클러스터하기 위해, 서브 네트워크는 그래프 이론의 구성들을 연결하는 유사한 모델링이 될 수 있다.

예를 들어, 유전자 상호 작용 네트워크로부터 파생된 서브 네트워크의 그래프 모델에서, 서브 네트워크와 기능적으로 연관된 유전자들은 그래프의 절점들(노드들) 나타내고, 이러한 기능적으로 연관된 유전자들 사이의 상호작용은 그래프의 각각의 노드들 사이의 간접적인 라인들로 표현된다.

클러스터 C는 폼의 서브 네트워크들의 한정된 셋으로 정의된다. C={G'1,G'2… ,G'k} 에서, G'1,G'2… ,G'k는 복수개의 서브 네트워크들이다. 예를 들면 복수개의 서브 네트워크들은 유전자 상호작용 네트워크 G에 속한다. 수학적으로, 상호작용 네트워크 G보다 더 큰 어떤 서브 네트워크(서브 그래프) G'는 튜플<V', E'> V' ⊆ V 와 E와 ⊆ E, V, V 는 유한한 절점들(노드들)의 셋(예를 들어, 유전자들 또는 개개의 네트워크)을 나타낸다. 만약 ∀v1, v2∈ V′, (v1, v2) ∈ E ⇔ (v1, v2) ∈ E′이면 G′은 유도된 서브 네트워크라고 한다. 만약

명시적으로 언급되지 않는 한, 서브 네트워크라는 용어는 유도된 서브 네트워크에 사용된다. 두 개의 유도된 서브 네트워크들은 같은 절점들의 셋을 가지고 있으면 동일하다고 발현한다.

도 1은 사용자 정의된 유사도에 기초로한 서브 네트워크의 클러스터링을 설명하는 흐름도(100)를 도시한다.

단계 101에서는,S셋의 복수개의 초기 클러스터들(클러스터들의 시드들) C1, C2, … Cn이 유전자 상호작용 네트워크 G의 복수개의 서브 네트워크들 G'1, G'2, … , G'k로부터 만들어진다.

단계 102에서는, 복수개의 지역 우선순위 큐들(로컬 힙들)과 글로벌 우선순위 큐(글로벌 힙)가 클러스터들 C1, C2, … Cn로부터 구축된다. 각각의 클러스터 Ck≠C1이고, 계산된 클러스터 Ck와 클러스터C1사이의 링크가 기설정된 링크 기준치 (link cutoff) 보다 크면(link(Ck,C1)>link cutoff) 클러스터들의 셋 S={C1, C2, … Cn}의 각각의 클러스터 C1에 대한 로컬 힙이 생성된다. 가장 높은 우선순위 (최우선순위)에 할당된 클러스터는 C1과 함께 가장 높은 링크를 가진다. 두 클러스터들 Ci와 Cj사이에는 클러스터

={ } 및 클러스터 ={ }가 아래의 <관계식1>에 의해 계산된다.

<관계식 1>

'rel'은 정규화 계수에 의해 정의된 유사도 계수를 계산하기 위한 맞춤화된(사용자 정의된) 기능적 관계 정량화이다. 클러스터링 알고리즘은 아래의 <관계식 2>에서 나타내는 정규화 함수의 곱을 사용한다.

<관계식 2>

normalize (n1, n2) = n1.n2

예를 들어 n1과 n2는 클러스터 Ci와 Cj 각각의 서브 네트워크들의 번호일 수 있다.예를 들어 n1과 n2는 클러스터링 알고리즘 이서브 네트워크들의 생성에 적용될 때, 서브 네트워크 안의 노드들의 개수일 수 있다. 일 실시예에서, 유전자 발현 p 값 기준치는 Ck와 Cl 사이에 링크가 존재하는지 여부를 결정하는데 사용된다. 만약 V가 유전자 상호작용 네트워크의 유전자들 셋이면, 유전자 발현은 E: V -> R≥0, R≥0 (양의 실수 셋)에 의해 매핑된다. 유전자 발현의 높은 값은 더 많이 발현된 유전자임을 나타낸다. 유전자 발현 p값은 Ep: V -> R≥0와 같이 매핑된다. 유전자 발현 p 값의 낮은 값은 더 많이 발현된 유전자를 나타낸다. 다양한 기능적 관계 정량화는 자카드 인덱스(Jaccard Index), CNIC 등과 같은 rel()함수를 사용하여 링크를 계산하는데 사용된다. 자카드 인덱스(Jaccard Index) : 두 개의 서브 네트워크들 A 및 B에 대 하여, Jaccar 인덱스는 J (A, B) = 로 정의되고, | |는 인자의 원소의 개수를 나타낸다.

CNIC: CNIC 는 체카노프스키-다이스(CD) 상호 작용 방법에 기초한다. 0차 상호작용은 c0 = (|A 상호 작용 방법 및 B에 대 하여로 정의된다. ?는 대칭차집합을 나타낸다.

(Kth차 상호작용은 ck= |Ak k|Bk|k |Ak|+ |Bk|) 로 정의된다.( Ak, Bk는 A및 B의 k번 건너뛴 이웃들이다.)

CNIC는 아래의 <관계식 3>에 의해 정의된다.

<관계식 3>

wi는 i번째 클러스터의 가중치이다. EIC: 주어진 2개의 서브 네트워크들 G'=(V',E') 및 G"=(V",E"), 0차 상호작용은 e0 = |V'∩V"|로 정의된다. 유전자 상호 관계의 문맥상 다중 중간 노드들을 포함하는 엣지의 상호관계들은 논리적으로 무시한다. 왜냐하면, 생물학적 네트워크의 작은 세계 효과 때문이다. EIC는 아래의 <관계식 4>에 의해 정의된다.

<관계식 4>

^e1=(w0.e0 + w1.e1 + w2.e2)/(|V'|+|V"|)

위의 <관계식4>에서 w1, w2, w3 들은 계수들에 대응하는 가중치들이다. EIC는 엣지 상호관계의 2개의 서브 네트워크들 사이에서 결합 기능을 설명하는 간단한 상호 작용 척도이다. 서브 네트워크들의 유전자 멤버들 사이에서 다중 상호작용들이 있으면 2개의 서브 네트워크들은 기능적으로 근접한다는 사실을 활용한다. EIC 와 달리 CNIC는 두 서브 네트워크 간의 상호 작용은 일반적인 이웃 노드들의 수에 비례한다는 아이디어에 기초한다. EIC 및 CNIC 값의 증가는 비교되는 서브 그래프 간의 긴밀한 상호 작용을 나타낸다. 클러스터 C= {G'1는 G'2은, ..., G'm}의 중량은 아래 <관계식 5>에 기재한다.

<관계식 5>

글로벌 우선순위 큐 (힙)의 Qg는 지역 우선순위 큐에서 가장 높은 우선순위 클러스터 (탑 클러스터)와의 링크에 대해 정렬(순위)된 각 클러스터를 포함한다. 단계 103에서는, 글로벌 힙의 탑클러스터를 확인하고, 글로벌 힙에서 선택한다.

단계 104에서는, 로컬 힙의 탑 클러스터를 로컬 힙에서 선택한다.

단계 105에서는, 글로벌 힙과 로컬 힙에서 선택된 2개의 클러스터들을 병합하여 새로운 클러스터(중간단계 클러스터)를 만든다. 선택된 클러스터들은 각각의 로컬 힙과 글로벌 힙에 대한 전반적인 클러스터 리스트에서 삭제된다.

단계 106에서, 로컬 힙은 새로운 클러스터들과 로컬 힙과 글로벌 힙에 대응되어 존재하는 모든 클러스터들 사이의 링크들을 계산하여 병합된 새로운 클러스터에 구축된다.

단계 107에서, 계산된 모든 링크값은 링크 기준치 값과 비교된다. 단계 108에서, 만약 모든 링크가 링크 기준치 값 위인 경우, 새 클러스터 내에서 병합 된 클러스터는 각각의 전역 힙 및 로컬 힙에 다시 전달된다. 이후 102 단계로 돌아간다. 글로벌 힙은 새로운 클러스터를 재고려하여 글로벌 힙으로 되돌려 업데이트 된다. 단계 107에서는, 모든 링크가 링크 기준치 값 아래에 있는 경우, 단계 109에서, 새로운 클러스터는 우선순위 큐 Fq에서 최종 클러스터로 반환된다. 각각의 클러스터의 가중치에 대해 정렬한 우선순위 큐 Fq는 반환되어 최종 클러스터들에 저장하기 위해 유지된다. 클러스터의 가중치는 위의 <관계식 5>로 계산된다. 클러스터링 알고리즘은 종료 조건을 결정하는 인자로 글로벌 힙의 최소 크기(예를들면, k를 말함)는 기설정된다. 생성된 최종 클러스터는 단일 클러스터로 그룹화 된 유사한 서브 네트워크를 포함한다.

또한, 102단계로 돌아가 복수개의 클러스터들을 제공하도록 나머지 클러스터들과 클러스터링 프로세스를 계속한다. 각각의 형성된 클러스터는 맞춤형 계수에 의해 정의된 사용자에 의해 정의된 각 클러스터 내에서 서브 네트워크 간의 유사성과 유사한 복수개의 서브 네트워크를 포함한다. 흐름도(100)에서 다양한 동작은 다른 순서로 또는 동시에, 제시된 순서로 수행 될 수 있다. 또한, 몇몇 실시 예에서, 어떤 나열된 동작은 도1에서 생략 될 수 있다.

도 2a는 일 실시예에 따른 향상된 계층적 클러스터링 알고리즘에 기초하여 환자의 그룹핑을 설명하는 예시도이다.

환자는 인간으로 제한하지 않지만 어떤 살아있는 기관/조직/세포 라인의 특정한 타입에도 적용된다. 시험 인구들 내의 모든 환자들의 경우 입력 시드 마커의 셋은 식별된다. 입력 마커 셋은 유전자 발현 레벨들과 연결도(예를 들어, 인체 상호작용체에 기초한) 같은 특성을 사용하여 환자에 대해 잠재적으로 연관된 유전자를 확인된다. 예를들어, 입력 시드 마커 셋은 환자의 유전자에서 추출되거나, 이전에 실행된 실험결과에서 추출되거나, 문헌 및 유사한 출처에서 추출될 수 있다. 클러스터하는 방법은 모든 관련 유전자의 완전한 데이터 셋을 필요로하지 않는다. 또한, 이 방법은 심지어 노이즈 데이터의 존재 또는 불완전한 관련 유전자들의 리스트에 대해서도 높은 정확도를 제공한다. 단계 201에서, 모든 환자에 대해, 서브 네트워크들은 인체 상호작용체 및 각 환자에 대해 정규화된 유전자 발현 레벨들을 이용하여 입력 시드 마커들 주변에 생성된다. 각 환자에 대한 서브 네트워크 생성은 입력 마커셋 안의 모든 입력 마커들을 인체의 셀룰러 단백질 - 단백질, 단백질-유전자 및 유전자-유전자와 같은 세포 환경 내의 생체분자 상호작용들의 완전한 셋을 거의 제공하는 인체 상호작용체의 위에 매핑하는 것을 포함한다. 또한, 각각의 입력 마커의 이웃에 있는 대부분의 차등적으로 발현된 마커들은 식별되고, 입력 마커는 서브 네트워크 안에서 점진적으로 성장한다. 서브 네트워크의 생성은 또한 아래의 도4 및 도5에서 설명된다. 이에 따라, 각 환자에 대한 복수개의 서브 네트워크들이 해당 환자의 식별 된 입력 시드 마커 세트 주위에 생성된다. 예를 들면, 병에 걸린 환자에 대한 서브 네트워크의 생성은 자카드 인덱스, CNIC 및 다른 관련된 유사한 서브네트워크 풀 같은 유사도 계수에 기초하여 질병 특정 서브 네트워크들의 생성에 대응한다.

또한 단계 202에서, 각 환자의 서브 네트워크는 유사한 서브 - 네트워크를 식별하고 클러스터한 것을 모은다. 모든 환자의 경우, 유사한 서브 네트워크는 병합 또는 클러스터라는 하나의 그룹에 모여 클러스터된다. 이러한 복수개의 클러스터들은 각 환자에 존재할 수 있다. 사용자 정의된 맞춤형 유사도 공동 효율성은 향상된 계층적 클러스터링 알고리즘을 사용하여 유사한 서브 네트워크를 그룹핑하는 클러스터링 기준 (유사성 기준)을 제공한다. 이 그룹은 각 환자에 대한 증강 마커 세트를 제공한다. 클러스터 된 서브 네트워크들의 각 그룹은 유전자 상호작용 네트워크 내에서 서브 네트워크의 더 결합된 그룹을 제공한다.

단계 203에서, 환자들에 따른 클러스터된 서브 네트워크는 모든 환자에 걸쳐 클러스터 데이터 세트를 생성하여 모은다. 클러스터들의 데이터 집합에서 특정 클러스터들은 여기서 식별된 관심 클러스터들로 참조된다.

예를 들어, 최종 어플리캐이션에 기초하여 환자 계층화 프로세스는 관심 클러스터들이 식별된다. 관심 클러스터들은 특정 최종 어플리케이션에 대한 환자 그룹핑에 대해 유의성을 가지고 발견된다. 관심 클러스터들은 의료 전문가에 의해 정의될수 있다.

단계 204에서, 관심 클러스터들이 초기화된다. 또한, 환자들에 대해 수집된 클러스터들의 데이터 셋은 다시 클러스터된다. 클러스터들의 성장은 관심 클러스터들에 의해 정의된 그룹들에 수집된 데이터셋을 그루핑하거나 클러스터하는 것을 의미한다. 관심 클러스터들의 성장은 사용자 정의 맞춤형 유사도 계수를 이용한 향상된 계층적 클러스터링 알고리즘에 기초한다.

그 후, 각각의 단계 205에서, 각각의 관심 클러스터들의 각 환자의 멤버쉽이 식별된다. 멤버십은 관심 클러스터들 내의 환자의 서브네트워크들의 존재 또는 부재를 기초로 하여 결정된다. 또한, 시험 인구 내의 전체 환자들 셋은 그들의 관심 클러스터들 내의 멤버쉽에 기초하여 그룹핑된다. 그들의 멤버쉽에 따른 환자들의 그룹핑은 K-민즈(K-means),, 계층적 클러스터링 등과 같은 클러스터링 방법을 이용하여 수행된다. 흐름도(200) 의 다양한 단계는 다른 순서로 또는 동시에 제시된 순서로 수행 될 수 있다. 또한, 몇몇 실시 예에서, 도 2a에 나열된 어떤 단계는 생략 될 수 있다.

특정 군의 환자들은 유사한 유전 특성을 나타낸다. 따라서, 특정 약물에 반응 한 환자의 지식을 갖는 것은 의료 컨설턴트가 동일한 그룹에 떨어지는 다른 환자의 약물 반응을 예측하도록 할 수있다. 이에 의료 컨설턴트가 약물의 불필요한 관리를 피하게 할 수 있다.

시험 인구(고려중인 환자의 그룹)내의 비반응군으로붙 약물 반응을 일관되고 예측 가능한 방식으로 묘사할 수 있는 능력은약물 유전 학적 의약품에 관한 현대적인 임상 시험에서 중요한 요소 중 하나이다. 이러한 치료들이 환자에게 심각한 부작용을 가져올 수 있기 때문에 유전 질환을 가진 환자를 치료하면서 약물 반응 예측이 중요하다. 예를 들어, 환자 그룹의 워크 플로우를 사용한 환자들의 그룹핑은 환자에 맞는 약물의 선택을 지원함으로써 환자에 대한 시간 효율적인 치료를 가능하도록 신뢰할 수 있는 환자 계층화를 제공한다.

도 2b는 일 실시예에 따른 향상된 클러스터링 알고리즘에 의해 생성된 환자 그룹핑의 실험 결과를 나타난 도면이다.

테이블 데이터는 더 높은 신뢰성을 제공하므로 어떤 선택된 입력 마커 셋의 조합에 대한 환자 계층화 프로세스는 더 높고 일관적인 정확도를 제공하는 방법을 나타낸다. 도면에 도시 된 바와 같이, 동일한 입력 마커 세트를 사용하여 환자 계층화 하기위한 기존의 방법에 의해 제공되는 정확도는, 비교적 낮고 따라서 덜 신뢰할 수 있다.

도 3은 일 실시예에 따른 폐암 환자들의 샘플 모집단에 실시한 환자 계층화의 결과의 예시를 나타낸 도면이다.

도 3은 관심 클러스터에 걸쳐 환자의 멤버쉽을 나타내는 그래픽 분석을 도시한다. 그래프는 특정 표적 약물에 대해 반응하고 무응답하는 폐암 환자 데이터를 도시한다. 세로축은 표적 약물에 대해 반응자와 비반응자를 포함하는 환자 인구를 나타낸다. 수평 축은 복수개의 관심 클러스터를 나타낸다. 지시된 블록들(301)은 특정 환자의 부분 인지 하나 이상의 관심 클러스터 C209, C230 및 C198의 멤버인지를 나타낸다. 마크된 클러스터(302)(C208)은 표적 약물에 대해 최대 반응자수와 적은 수의 비반응자 수를 나타낸다. 따라서, 결과는 표적 약물을 투여하기 전에 환자를 계층화하는 의료 컨설턴트를 돕는다. 결과는 의료 컨설턴트가 약물에 반응 할 가능성이 가장 높은 환자에게만 약을 복용하도록 할 수 있다. 환자가 클러스터 C208의 멤버쉽이라면 식별에 의해 환자가 표적 약물에 대한 반응자인지 예측된다. 위와 같은 분석은 암 환자 데이터의 예이다. 클러스터하는클러스터하는 방법은 타깃 항생제로서 선택된 특정 약물에 대한 환자 계층화에 동일하게 적용 할 수있다. 환자 계층화의 약물 반응 예측은 환자의 빠른 회복의 결과로 가장 효과적인 약물을 선택할 수있는 의료 컨설턴트를 지원한다.

도 4는 일 실시예에 따라 더 큰 유전자 양방향 네트워크로부터 서브 네트워크의 생성을 설명하는 흐름도이다.

단계 401에서, 흐름도(400)에 도시 된 바와 같이, 서브 네트워크 생성을 위한 시드 마커는 초기화된다. 시드 마커는 환자 그룹핑이 적용되는 상황에서 가장 중요한 것으로 간주되는 선택된 마커들의 셋에 대응한다. 일 실시 예에서 시드 마커들은 문헌에서 데이터 수집하거나 종래 실시한 실험으로부터 선택 될 수있다. 일 실시 예에서, 가장 차별적으로 발현된 마커들은 시드 마커로 선택될 수 있다. 일 실시 예에서, 시드 마커들의 셋은 문헌에서 식별된 마커들과 가장 차별적으로 발현된 마커들의 조합이 될 수 있다.

단계 402에서, 첫번째 레벨 서브 네트워크들은 주변에서 차별적으로 발현된 마커들을 식별한 발현을 기초로하여 각 시드 마커 주변에서 생성된다.

단계 403에서, 첫번째 레벨 서브 네트워크가 생성되면, 첫번째 레벨 서브 네트워크들은 반복적인 기록함수를 이용하여 더욱 성장한다. 예를 들어, 기록 함수는 로그 라이크리후드 함수의 1차 도함수로서 문헌에 정의된 피셔의 기록함수가 될 수 있다. 또한 각각의 첫번째 레벨 서브 네트워크에 대한 기록함수는 피셔의 기록함수와 같은 기설정된 기록함수에 기초하여 계산된다.

예를 들어 m유전자들을 가지는 서브 네트워크 G'에 대하여 계산된 n유전자들을 가지는 유전자 상호작용 네트워크 G에 대한 기설정된 기록 함수는 아래의 <관계식 6>을 사용하여 계산된다.

<관계식 6>

Score(G / G ')는 f(n,n',n”,m,m',m”)

여기서, n' 및 n”는 유전자 상호작용 네트워크 G의 포커스 유전자들 및 n유전자중들 중 각각의 특권 유전자의 수이고, m' 및 m”는 유전자 상호작용 네트워크 G'의 포커스 유전자들 및 m유전자중들 중 각각의 특권 유전자의 수이다. 예를 들어, 유전자의 상호 작용 네트워크의 최고 발현 유전자들은 포커스 유전자들로 참조된다. 유전자들은 유전자들의 유전자 발현 값들에 대해 내림차순으로 랭크되거나, 유전자들의 p값에 대해 오름차순으로 랭크된다. 발현 값 또는 발현 p값 기준치는 지정되고 탑 유전자들은 p 값 기준치와 만나는 포커스 유전자들로 선택된다.

특권 유전자들은 생물학자들 또는 전문가들에 의해 유전자 상호작용 네트워크 전반에서 선택된다. 특권 유전자들은 몇몇 질병 또는 약물 반응에 특정하여 관계된다. 특권 유전자들은 포커스 유전자들과 독립적이다. 피셔의 기록함수에 대한 <관계식6>을 수정하면 아래의 <관계식 7>과 같다.

<관계식 7>

n 유전자들은 'n' 포커스 유전자들 및 'n' 특권 유전자들을 포함한다. 또한, 주변의 차별적으로 발현된 마커와 합병되기 전에 첫번째 레벨 서브 네트워크의 먼저 계산된 기록보다 뛰어난 성장된 서브 네트워크 결과의 기록(기록함수)과 같이 주변에서 가장 차별적으로 발현된 마커와의 합병으로 각각의 첫번째 레벨 서브 네트워크가 성장된다

단계 404에서는, 성장된 첫번째 레벨 서브 네트워크들은 서브 네트워크들에서 파생되어 병합된다. 서브 네트워크들의 크기를 제한하는 기설정된 상위 차단 기준치가 설정된다. 상위 차단 기준치는 기설정된 한계치를 넘어 매우 큰 서브 네트워크가 생성되는 것을 제한한다. 왜냐하면 매우 큰 서브 네트워크들은 유사도 또는 약물 반응성에 대해 무의미 할 수 있기 때문이다. 클러스터하는 방법은 차별적 마커 발현들에 대하여 관계있는 서브 네트워크들의 생성을 용이하게 한다. 기존의 유전자 발현 기반 네트워크 생성 기술과는 달리, 클러스터하는 방법은 각각 특정 크기 기준을 만족하는 서브 네트워크를 생성할 수 있도록 한다. 흐름도 400에서의 다양한 동작은 다른 순서로 또는 동시에, 제시된 순서로 수행 될 수 있다. 또한, 몇몇 실시 예에서, 도 4에 나열된 어떤 동작은 생략 될 수 있다.

클러스터하는 방법은 유전자 상호작용 네트워크를 참조하여 서브 네트워크의 생성을 설명한다. 그러나, 더 큰 네트워크 내에서 서브 네트워크를 생성하는 것은 네트워크의 독립체들 간의 관계가 차별적으로 발현되는 다른 어떤 네트워크에서도 동일하게 적용된다. 예를 들면, 소셜 네트워크의 멤버들 사이의 메시징은 일반적으로 특정 숫자로 추정 될 수 있다. 메시징의 갑작스런 증가 또는 감소는 차별적으로 발현된 마커들과 유사하게 식별되는 차별적으로 발현된 멤버들의 비례 지표의 변화가 발생된 것으로 발현될 수 있다. 클러스터하는 방법은 기록 함수 또는 클러스터링 알고리즘에 기초하여 성장된 첫번째 레벨 서브 네트워크들을 병합하기 위해 이용되는 여러 실시 예들을 제공한다. 성장된 서브 네트워크들의 병합은 도 6에서 상세히 설명한다.

도 5는 일 실시예에따라, 구별하여 발현된 마커들의 첫번째 레벨의 서브 네트워크의 생성을 기초로 한 발현을 설명하기 위한 흐름도이다.

흐름도(500)의 단계 501에서는, 시드 마커들의 셋을 초기화한다. 단계 502에서는, 초기화된 시드 마커들의 셋으로부터 시드 마커k 중 한 개한 선택된다. 선택된 시드 마커는 인체 상호작용체 또는 유전자 발현 데이터베이스에 매핑된다. 단계 503에서는, 주변의 선택된 시드 마커에서 가장 차이나게 발현된 마커가 결정된다. 일 실시예에서, 주변에서 가장 차이나게 발현된 마커는 유전자 발현 p값에 기초하여 결정된다. 일 실시예에서, z기록 또는 마커에 의해 발현된 차별적 발현에 비례한 차별적 발현을 캡쳐한 다른 어떤 지표에 기초하여 주변이 결정된다.

단계 504에서, 만약 가장 차이나게 발현된 마커가 탐색되지 않으면, 단계 505에서 초기호된 시드 마커의 셋으로부터의 다음 시드 마커를 선택하고 단계 502로 돌아간다.

단계 506에서, 선택된 시드 마커는 시드 마커에서 탐색된 가장 차별적으로 발현된 마커를 추가하여 성장된다.

단계 507에서, 추가된 가장 차이가 나게 발현된 마커가 시드 마커들의 셋에 속하면, 단계 508에서, 시드 마커들의 셋이 업데이트된다. 업데이팅은 시드 마커들의 셋으로부터 최근 추가된 가장 차이나게 발현된 마커의 삭제를 포함한다. 클러스터하는 방법에서, 모든 추가된 가장 차이나게 발현된 마커는 생서된 첫번째 레벨 서브 네트워크 중 오직 하나에 포함된다. 단계 509에서, 성장된 시드 마커의 마커 카운트가 기설정된 기준치 마커 카운트 이하인면, 단계 510에서, 성장된 시드 마커의 주변에서 다음으로 가장 차이나게 발현된 마커가 선택된다. 또한 클러스터하는 방법은 단계 504로 돌아가고 시드 마커의 성장은 계속된다.

단계 509에서는, 성장된 시드 마커의 마커 카운트가 기설정된 기준치 마커 카운트 이상이고, 단계 511에서, 첫번째 레벨 서브 네트워크 생성에 대해 셋으로부터의 모든 시드 마커들이 고려되지 않았으면, 단계 504로 돌아간다.

단계 504에서, 서브 네트워크의 다음 시드가 선택되고 단계 501로 돌아간다. 만약 모든 시드 마커들이 고려되었으면, 단계 512에서는, 첫번째 레벨 서브 네트워크들의 생성이 중단된다. 흐름도(500)의 다양한 동작들은 다른 순서로 또는 동시에, 제시된 순서로 수행 될 수 있다. 또한, 몇몇 실시 예에서, 도 5에 나열된 어떤 동작은 생략 할 수 있다. 이렇게 생성된 첫 번째 레벨의 서브 네트워크는 도 4의 단계 403에 설명한 바와 같이, 기록 함수를 사용하여 첫번째 레벨 서브 네트워크들을 성장하기 위하여 처리된다.

도 6은 일 실시 예에 따라, 성장한 첫번째 레벨의 서브 네트워크들과 주변에서 가장 차이나게 발현된 유전자를 병합하여 만든 더 큰 서브 네트워크의 예시를 나타낸 도면이다.

도 6은 2개의 완전히 성장된 각각의 서브 네트워크들 G1(602)과 G2(603)를 병합하여 생성된 더 큰 서브 네트워크(601)을 도시한다. 두개의 서브 네트워크들 G1(602)과 G2(603)는 주변에서 가장 차이나게 발현된 마커 (604)와 병합된다. 선택되 발현 마커에 대해 차별적 마커 발현 값인 2.5와 주변의 다른 마커의 차별적 마커 발현 값(예를 들면 1 및 2값들)이 비교된다. 주변에서 가장 차이나게 발현된 마커는 서브 네트워크들 G1(602) 및 G2(603) 각각에 직접적으로 연결한다. 서브 네트워크들을 병합하는 기존의 방법들과 달리, 클러스터하는 방법은, 모서리나 연결 카운트 대신에 차별적 마커 발현을 이용한다.

예를 들어 차별적으로 발현된 마커 또는 마커 쌍은 차별적으로 발현된 유전자 또는 유전자쌍이 될 수 있다. 예를 들어, 도면에 도시된 어떤 직접적으로 연결된 유전자 g1 과 g2는 두 개의 서브 네트워크들 G1 및 G2가 직접적인 연결을 통해 병합하기 위한 후보가 되고, 만약 g1의 차별적인 발현이 g2의 차별적인 발현보다 크다면(E(g1)>E (g2)) g2보다 g1이 고려된다. 예를 들어, p값을 이용한 차별적 발현에서는, Ep(g1)<Ep(g2)면 유전자 g2 보다 유전자 g1이 선택된다. 유전자 g1과 g2가 동일한 발현 값을 가질 경우, 클러스터하는 방법은 병합될 두 서브 네트워크들 g1 및 g2의 주변의 유전자를 임의로 선택한다. 일 실시 예에서, 클러스터하는 방법은 두 개의 서브 네트워크들 G1(602) 및 G2(603) 사이를 연결하는 유전자 쌍 <g3,g4>(605) 과 같은 유전자 쌍을 기초로 하여 두 개의 서브 네트워크를 병합하여 더 큰 서브 네트워크를 형성한다. 예를 들어, f는 f: R × R aR 형태의 함수이고 R은 양의 실수의 집합일 때, f(E(g3), E(g4)) > f(E(g1'),E(g2')) 또는 f(Ep(g3), Ep(g4)) < f(Ep(g1'),Ep(g2')) 이면 서브 네트워크들 G1(602) 및 G2(603)를 병합하기 위해 연결한 유전자 쌍 <g3, g4>(605)와 다른 어떤 존재하는 연결 쌍 <g1', g2'>, 연결 쌍 <g3, g4>(605)가 선택된다. f(E(g3), E(g4))와 f(E(g1'),E(g2'))이 동일하거나 f(Ep(g3), Ep(g4))와 f(Ep(g1'),Ep(g2'))가 동일하면 연결 쌍은 임의로 선택된다. 클러스터하는 방법은 두 가지 유형의 후보가 존재할 경우 단일 마커 병합 옵션 또는 마커 쌍 병합 옵션 중에서 우선순위를 정의할 수 있다. 우선순위는 요구 사항에 따라 결정된다. 클러스터하는 방법은 다중 건너뛰기(hop)을 통해 연결된 서브 네트워크를 병합할 수 있다.고려해야할 건너뛰기(hop)의 수는 기 설정되어있다.

일 실시 예에서, 클러스터하는 방법은 기록 함수에 대해 두 개의 서브 네트워크를 병합하는 일반화 된 프레임 워크를 제공한다. 정수 값으로 지정된 병합하는 순서가 선택된다. 선택된 순서는 병합된 두 개의 서브 네트워크 간의 직접적으로 연결된 마커들의 수를 지정한다. 만약 서브 네트워크 A와 서브 네트워크 B 사이에 k개의 직접 연결된 마커들이 있고, k'은 병합의 순서이면, k'의 서브셋 이 선택된다. 또한 A 및 B를 병합하고, 그에 따른 서브네트워크의 기록을 최적화하기 위해 서브셋들 로부터의 하나의 서브셋이 선택된다. 일 실시 예에서, 클러스터하는 방법은 스코어링 함수에 대해 두 개의 서브 네트워크의 병합을 제공한다. k개의 직접 연결된 마커들이 서브 네트워크 A와 B사이에 존재하면, k 마커들로부터의 모든 서브 셋들이 선택된다. 또한 A와 B를 병합하고, 그에 따른 서브 네트워크의 기록을 최적화하기 위해 위해 서브 셋들 중에 서브셋이 선택된다. 일 실시 예에서 클러스터하는 방법은 클러스터링 알고리즘을 사용하여 성장 된 첫번째 레벨의 서브 네트워크를 병합한다.

도 7은 일 실시 예에 따라, 바이오 마커를 정교화하는 예를 설명하기 위한 흐름도이다.

도 7은 새로운 바이오마커들을 찾기 위해 사용되는 클러스터링 알고리즘을 도시한다. 질병 특이적 특권 유전자들의 불완전한 셋이 주어지고, 도4 및 도5에서 설명한대로 생성된 서브네트워크들의 입력 마커로 사용된다. 생성된 서브 네트워크들은 사용자 정의로 맞춤화된 유사도 계수를 기초로한 클러스터링 알고리즘을 이용하여 그룹핑된다. 서브 네트워크들 그룹들의 부린 매칭의 존재가 아니라 맞춤화된 유사도 계수에 기초한 서브 네트워크들의 클러스터링이 정제 또는 바이오마커들(클리니컬 마커들)의 선택을 가능케한다.

예를 들어, 바이오 마커들의 정제는 유전자 상호작용 네트워크의 높게 발현된 부분과 상호작용하는 유전자 상호작용 네트워크의 하나 이상의 차별적으로 발현된 유전자를 식별한다. 맞춤화된 유사도 계수를 바탕으로 한 클러스터링은 유전자 상호작용 네트워크로부터의 서브 네트워크의 상호작용 등을 결정하도록 할 수 있다. 예를 들어 차별적으로 발현된 유전자(바이오마커)는 살아있는 기관내의 암 발전에서 치명적인 역할을 수행하는 잠재적인 중요한 유전자가 될 수 있다. 클러스터하는 방법은 상호 작용하는 서브 네트워크들과 함께 바이오 마커들을 클러스터하여 바이오 마커의 정제를 할 수 있다. 생성된 클러스터들의 분석은 이후 새로운 바이오 마커들의 식별을 가능하게 한다. 워크 플로우 다이어그램(700)에서의 다양한 동작은 다른 순서로 또는 동시에, 제시된 순서로 수행 될 수있다. 또한, 몇몇 실시 예에서, 도 7에 나열된 어떤 동작은 생략 될 수있다. 일 실시 예에서, 특정 기록 함수들은 특권 바이오 마커들을 선택하기 위해, 식별 된 서브 네트워크를 위해 정의 될 수 있다.

도 8은 일 실시예에 따라, 향상된 계층적 클러스터링 알고리즘을 사용하여 더 큰 네트워크의 복수개의 서브 네트워크들을 클러스터하는 방법 및 시스템을 실행하는 컴퓨팅 환경을 나타낸 도면이다.

도 8에 도시된 컴퓨팅 환경 (801)은 제어부 (802)와 산술 논리 유닛 (ALU) (803), 메모리 (805), 저장부 (806), 복수개의 통신부(808) 및 복수개의 입출력부(807)를 갖춘 적어도 하나의 프로세싱부(804)를 포함한다. 프로세싱부(804)는 알고리즘의 명령어를 처리할 책임이 있다. 프로세싱부(804)는 프로세싱을 수행하기 위해 제어부(802)로부터 명령어들을 받는다. 또한, 명령의 실행에 관련된 논리 및 산술 연산은 ALU (803)의 도움으로 계산된다.

전체 컴퓨팅 환경 (801)은 다수의 동종 또는 이종의 코어, 다른 종류의 특수 매체 및 다른 가속기의 다중 CPU로 구성 될 수 있다. 프로세싱부(804)는 알고리즘의 명령어를 처리할 책임이 있다. 또한, 복수개의 프로세싱부(804)는 단일 칩 또는 그이상의 다중 칩 위에 위치 될 수있다.

구현에 필요한 명령어 및 코드로 이루어지는 알고리즘은 메모리(805) 또는 스토리지 (806) 또는 둘 모두에 저장된다. 명령어를 실행하는 시간에, 명령어들은 대응하는 메모리(805) 또는 저장부(806)로부터 페치(fetch)될 수 있고, 프로세싱부(804)에 의해 실행된다. 하드웨어를 구현할 때, 다양한 통신부(808) 또는 입출력부(807)는 통신부(808)와 입출력부(807)의 구현을 지원하는 컴퓨텅 환경(800)에 연결될 수 있다. 실시 예들은 적어도 하나의 하드웨어장치에서 실행되는 적어도 하나의 소프트웨어 프로그램 과 실행 요소를 제어하는 네트워크 관리 기능들의 수행을 통해 구현될 수 있다. 도 8에 도시된 요소들은 적어도 하나의 하드웨어 장치 또는 하드웨어 장치와 소프트웨어 모듈의 조합을 할 수 있는 블록을 포함한다.

본 실시 예들에 따른 장치는 프로세서, 프로그램 데이터를 저장하고 실행하는 메모리, 디스크 드라이브와 같은 영구 저장부(permanent storage), 외부 장치와 통신하는 통신 포트, 터치 패널, 키(key), 버튼 등과 같은 사용자 인터페이스 장치 등을 포함할 수 있다. 소프트웨어 모듈 또는 알고리즘으로 구현되는 방법들은 상기 프로세서상에서 실행 가능한 컴퓨터가 읽을 수 있는 코드들 또는 프로그램 명령들로서 컴퓨터가 읽을 수 있는 기록 매체 상에 저장될 수 있다. 여기서 컴퓨터가 읽을 수 있는 기록 매체로 마그네틱 저장 매체(예컨대, ROM(read-only memory), RAM(random-access memory), 플로피 디스크, 하드 디스크 등) 및 광학적 판독 매체(예컨대, 시디롬(CD-ROM), 디브이디(DVD: Digital Versatile Disc)) 등이 있다. 컴퓨터가 읽을 수 있는 기록 매체는 네트워크로 연결된 컴퓨터 시스템들에 분산되어, 분산 방식으로 컴퓨터가 판독 가능한 코드가 저장되고 실행될 수 있다. 매체는 컴퓨터에 의해 판독가능하며, 메모리에 저장되고, 프로세서에서 실행될 수 있다.

본 실시 예는 기능적인 블록 구성들 및 다양한 처리 단계들로 나타내어질 수 있다. 이러한 기능 블록들은 특정 기능들을 실행하는 다양한 개수의 하드웨어 또는/및 소프트웨어 구성들로 구현될 수 있다. 예를 들어, 실시 예는 하나 이상의 마이크로프로세서들의 제어 또는 다른 제어 장치들에 의해서 다양한 기능들을 실행할 수 있는, 메모리, 프로세싱, 로직(logic), 룩 업 테이블(look-up table) 등과 같은 직접 회로 구성들을 채용할 수 있다. 구성 요소들이 소프트웨어 프로그래밍 또는 소프트웨어 요소들로 실행될 수 있는 것과 유사하게, 본 실시 예는 데이터 구조, 프로세스들, 루틴들 또는 다른 프로그래밍 구성들의 조합으로 구현되는 다양한 알고리즘을 포함하여, C, C++, 자바(Java), 어셈블러(assembler) 등과 같은 프로그래밍 또는 스크립팅 언어로 구현될 수 있다. 기능적인 측면들은 하나 이상의 프로세서들에서 실행되는 알고리즘으로 구현될 수 있다. 또한, 본 실시 예는 전자적인 환경 설정, 신호 처리, 및/또는 데이터 처리 등을 위하여 종래 기술을 채용할 수 있다. “매커니즘”, “요소”, “수단”, “구성”과 같은 용어는 넓게 사용될 수 있으며, 기계적이고 물리적인 구성들로서 한정되는 것은 아니다. 상기 용어는 프로세서 등과 연계하여 소프트웨어의 일련의 처리들(routines)의 의미를 포함할 수 있다.

본 실시 예에서 설명하는 특정 실행들은 예시들로서, 어떠한 방법으로도 기술적 범위를 한정하는 것은 아니다. 명세서의 간결함을 위하여, 종래 전자적인 구성들, 제어 시스템들, 소프트웨어, 상기 시스템들의 다른 기능적인 측면들의 기재는 생략될 수 있다. 또한, 도면에 도시된 구성 요소들 간의 선들의 연결 또는 연결 부재들은 기능적인 연결 및/또는 물리적 또는 회로적 연결들을 예시적으로 나타낸 것으로서, 실제 장치에서는 대체 가능하거나 추가의 다양한 기능적인 연결, 물리적인 연결, 또는 회로 연결들로서 나타내어질 수 있다.

본 명세서(특히 특허청구범위에서)에서 “상기”의 용어 및 이와 유사한 지시 용어의 사용은 단수 및 복수 모두에 해당하는 것일 수 있다. 또한, 범위(range)를 기재한 경우 상기 범위에 속하는 개별적인 값을 포함하는 것으로서(이에 반하는 기재가 없다면), 상세한 설명에 상기 범위를 구성하는 각 개별적인 값을 기재한 것과 같다. 마지막으로, 방법을 구성하는 단계들에 대하여 명백하게 순서를 기재하거나 반하는 기재가 없다면, 상기 단계들은 적당한 순서로 행해질 수 있다. 반드시 상기 단계들의 기재 순서에 한정되는 것은 아니다. 모든 예들 또는 예시적인 용어(예를 들어, 등등)의 사용은 단순히 기술적 사상을 상세히 설명하기 위한 것으로서 특허청구범위에 의해 한정되지 않는 이상 상기 예들 또는 예시적인 용어로 인해 범위가 한정되는 것은 아니다. 또한, 당업자는 다양한 수정, 조합 및 변경이 부가된 특허청구범위 또는 그 균등물의 범주 내에서 설계 조건 및 팩터에 따라 구성될 수 있음을 알 수 있다.

标题	发布/更新时间	阅读量
体纹理合成方法、装置与设备	2020-05-08	326
医疗器械图像检测方法及装置	2020-05-08	373
一种基于数据中台的用户窃电行为分析预警方法	2020-05-08	288
一种基于时间序列聚类的流域洪水响应相似性分析方法	2020-05-08	303
一种基于头脑风暴优化的舰载飞机出动调度规划方法	2020-05-08	753
信用评分模型的构建方法、装置、设备及存储介质	2020-05-08	41
电网三相不平衡多维时序分析方法	2020-05-08	627
使用深度学习算法来评价输入数据	2020-05-08	486
基于互联网的图片自动合成系统	2020-05-08	863
酒店评分方法、酒店推荐方法、电子装置和存储介质	2020-05-08	214

향상된 계층적 클러스터링 알고리즘을 이용하여 상호작용 네트워크로부터 복수개의 서브 네트워크들을 클러스터하는 방법 및 장치

该功能需要专业版企业版VIP权限，您可以：