천문학

SDSS 데이터 사용 / 카탈로그 찾기

SDSS 데이터 사용 / 카탈로그 찾기


We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

나는 라인 플럭스와 항성 질량에 대한 정보가있는 낮은 적색 편이 은하 (바람직하게는 SDSS)의 카탈로그를 찾고 있습니다. 내 Google 검색은 계속해서 Portsmouth 그룹에서 일하도록 지시했기 때문에 페이지 하단에 나열된 몇 가지 fits 파일을 다운로드했지만 해당 파일에는 라인 플럭스가 없다고 제안하는 것처럼 보이지만 해당 파일에는 라인 플럭스가 없습니다. 내가 찾고있는 것이 공개적으로 사용 가능한지, 올바른 장소에서 찾고 있는지 궁금합니다. 그들의 페이지는 내가 사용하고 싶은 모든 키워드를 나열하는 테이블로 연결되지만 데이터를 얻는 방법을 잘 모르겠습니다.

내가 다운로드 한 파일 중 하나 (portmouth_emlinekin_full-26.fits) BPT 분류 (Seyfert, LINER, Starforming…)를 나열하는 BPT라는 열이 있으므로 "빌딩 블록"([OIII], [NII], [SII], [OII]도 찾을 수있을 것으로 예상했습니다. , Halpha 및 Hbeta 라인 플럭스). 일반적으로 이와 같은 것에 대해 저자에게 연락해야합니까?

더 경험이 많은 과학자로부터 공개적으로 사용 가능한 설문 조사 데이터를 사용하는 것에 대해 배우면 매우 감사 할 것입니다. :)


내가 볼 수 있듯이 당신은 이미 당신이 찾고 있던 것을 찾았습니다. 연결 한 테이블은 CAS (카탈로그 보관 서버) 데이터베이스에서 사용 가능한 데이터에 대한 설명입니다. 지금해야 할 일은 테이블 이름을 사용하고 (대중이 여기와 여기에 다른 테이블에있는 것 같습니다) 원하는 것을 검색하는 것입니다. 제약 조건이없는 경우 하늘 지역으로 검색 할 수 있지만 짝수 조인 테이블을 수동으로 선택할 수 있으므로 SQL 쿼리를 사용하는 것이 좋습니다. 간단한 예를 들어 보겠습니다.

EmissionLinesPort에서 TOP 10 p.specObjID, p.ra, p.dec, p.z, p.bpt, p.Flux_NeV_3425를 p WHERE p.z BETWEEN 0과 2로 선택합니다.

0과 2 사이의 적색 편이가있는 처음 10 개의 결과가있는 테이블이 표시됩니다. 열은 [NeV] 3425의 ID, 적경, 적위, 적색 편이, 분류 및 플럭스 (연결 한 표에 설명 된 모든 것)가됩니다. 매스의 경우 편집하여 테이블을 변경해야합니다. 방출 선 포트 및 사용 stellarMassStarFormingPort 또는 stellarMassPassivePort 대신 (또한 그에 따라 열을 변경하십시오).


SDSS 데이터 사용 / 카탈로그 찾기-천문학

목표 : SDSS 데이터 릴리스 5에서 은하군을 추출하여 초 은하단-공극 네트워크와 그 안에있는 그룹의 환경 적 특성을 연구합니다. 밀도 향상으로서 은하 그룹을 사용하여 초 은하단-공극 네트워크의 광도 밀도 장을 결정할 수 있습니다.
방법 : 우리는 선택 효과를 제거하고 가능한 한 많은 그룹을 안정적으로 찾기 위해 가로 방향 및 방사형 방향으로 약간 가변적 인 연결 길이를 가진 수정 된 친구의 친구 (FoF) 방법을 사용합니다. 연결 길이의 스케일링을 결정하기 위해 가까운 그룹을 더 먼 거리로 이동하여 그룹 크기와 그룹 내의 평균 은하 수 밀도를 보정했습니다.
결과 : 최종 샘플에는 적도에 17,143 개 그룹이 있고 DR5 조사의 북부에는 33,219 개 그룹이 포함되어 있습니다. 그룹 카탈로그는 CDS에서 제공됩니다.
결론 : 우리 그룹의 평균 크기와 속도 분산은 실제로 거리에 따라 변하지 않습니다. 이는 그룹 카탈로그를 생성 할 때 선택 효과가 적절하게 고려되었음을 의미합니다.


고관

VizieR은 자체 문서화 된 데이터베이스에 정리 된 온라인으로 사용할 수있는 게시 된 천문 카탈로그 및 데이터 테이블의 가장 완벽한 라이브러리에 대한 액세스를 제공합니다. 쿼리 도구를 사용하면 관련 데이터 테이블을 선택하고 주어진 기준과 일치하는 레코드를 추출하고 형식을 지정할 수 있습니다. 현재 21067 카탈로그를 사용할 수 있습니다. 더 많은 정보
VO 호환성

VizieR은 여러 인터페이스를 통해 액세스 할 수있는 검증되고 강화 된 데이터와 함께 게시 된 천문 카탈로그 (표 및 관련 데이터)의 가장 완벽한 라이브러리를 제공합니다. 쿼리 도구를 사용하면 관련 데이터 테이블을 선택하고 주어진 기준과 일치하는 레코드를 추출하고 형식을 지정할 수 있습니다. 현재 21067 개의 카탈로그를 사용할 수 있습니다.
VO 호환성

VizieR Mine은 하늘 지역에 존재하는 카탈로그를 찾기위한 그래픽 인터페이스입니다.

Kohonen Self-Organizing Map은 유사한 내용을 가진지도 카탈로그의 근처 위치에 그룹화합니다.

선적 서류 비치

VizieR 및 Virtual 영형bservatory

  • VizieR은 고급 모드에서 결과를 제공 할 수 있습니다. VOTable, 가상 관측소 도구와의 호환성을 보장하는 형식입니다.
  • VizieR 테이블은 VO 표준에 의해 쿼리 가능 꼭지 SQL 언어 확장을 사용하는 ADQL.
  • 다음을 사용하여 VizieR로 검색 콘 검색 VO 표준.
  • 다음을 사용하여 VizieR에서 스펙트럼 / 시계열 검색 SSA.
  • 다음을 사용하여 VizieR에서 이미지 검색 SIA.

거울

VizieR 팀

이 서비스는 Francois Ochsenbein이 만들었으며, 현재 CDS Patricia Vannier의 Gilles Landais와 Pierre Ocvirk가 관리하고 있으며, Emmanuelle Perret, Marianne Brouty 및 Sylvain Guehenneux는 CDS에서 표 형식 자료 준비를 담당하고 있으며 Greg Schwarz가 처리합니다. AAS 저널의 표 형식 자료. 모든 기여자, 저자 및 편집자에게도 감사드립니다.

Thomas Boch, Francois Xavier Pineau는 또한 대규모 카탈로그 인구 (GLIMPSE, WISE,.)에 기여합니다.

VizieR은 처음에는 CDS (Centre de Données astronomiques de Strasbourg)와 ESA-ESRIN (정보 시스템 사업부)의 공동 노력으로 시작되었으며 현재 CDS에서 완전히 관리하고 있습니다. VizieR은 1996 년부터 사용 가능했으며 A & AS 143, 23 (2000)에 발표 된 논문에 설명되어 있습니다.

VizieR에는 사용 가능한 모든 온라인 카탈로그가 포함되어 있지는 않습니다. 일부 카탈로그는 적합하지 않으며 자주 사용되지 않는 일부 카탈로그는 아직 VizieR 데이터베이스에 통합되지 않았습니다. 이 마지막 항목은 Astronomer 's Bazaar에서 FTP로 액세스 할 수 있습니다.


이미지들

SDSS의 목표는 5 개의 다른 파장의 빛에서 대략적으로 North Galactic Cap의 영역 인 하늘의 1/4에서 23 등급보다 밝은 모든 물체를 이미지화하는 것입니다. 망원경이 작동하는 방식 때문에 데이터는 연속적인 태피스트리로 수집됩니다. 데이터는 상호 운용되는 파이프 라인 세트로 전달되어 결함에 대한 데이터를 수정하고, 천문 및 측광 보정을 계산 및 적용하고, 하늘 배경을 측정하고, 개체를 찾고, 측정하고, 카탈로그를 작성합니다. 마지막 단계가 가장 많은 시간이 소요되기 때문에 데이터 스트림은 일련의 필드로 분할되며 각 필드는 독립적으로 처리됩니다.

점 성계 보정 (각 물체에 정확한 좌표 할당)은 천 체계 파이프 라인 (Astrom)에 의해 수행됩니다. 측광 보정 (각 실행 중 대기 조건 측정)은 모니터 망원경 파이프 라인 (MT)에 의해 생성됩니다. 이 보정에 사용 된 별은 주 2.5m 망원경으로 관찰하기에는 너무 밝기 때문에 2.5m 스캔과 겹치는 하늘 패치가 모니터 망원경으로 관찰됩니다. 이 보조 패치는 MT 측광 시스템을 주요 2.5m 관측치에 연결하는 데 사용됩니다.

포토 메트릭 파이프 라인 (Photo)은 이미징 데이터를 천체에 대한 정보로 변환합니다. 사진은 세 개의 연속 파이프 라인으로 구성됩니다. 이 중 마지막 프레임 파이프 라인은 필드를 포함하는 5 개 프레임의 개별 세트에서 작동합니다. 사진은 각 프레임의 아티팩트 (불량 기둥, 우주선 등)를 수정하고, 검출기 배경 및 감도 변화를 수정하고, 두 단계 (밝고 희미 함)에서 개체를 찾고, 비닝 된 이미지에서 표면 밝기가 낮은 개체를 검색하고 다섯 필터의 개체. 그런 다음 Photo는 개체 (위치, 크기, 모양, 개수)를 측정하고, 분류하고, 복합 개체를 분석하여 개별 구성원에 대한 정보를 얻고, 아틀라스 이미지를 자릅니다. 그런 다음 Photo는 측정 된 매개 변수 테이블, 수정 된 프레임, 개체가 제거 된 4 픽셀 정사각형 하늘 프레임, 아틀라스 이미지, 마스크 프레임 (포화 또는 보간 된 픽셀과 같은 실수를 처리하기 위해), 각 프레임에 대한 요약 통계 등 일련의 출력을 작성합니다.

이러한 계산을 수행하려면 프레임 파이프 라인이 감지기의 속성과 하늘 배경을 알아야합니다. 이러한 속성은 전체 실행에 대해 이러한 수량을 계산하고 각 프레임의 중앙에 삽입하는 PSP (Postage Stamp Pipeline)에 의해 계산됩니다. PSP는 밝은 (그러나 불포화 된) 별의 컷 아웃 이미지를 사용하고, 나쁜 별 (이중 별 등)을 거부하고, 별 이미지의 모양 인 단순 점 확산 함수 (PSF)의 매개 변수를 계산합니다. 컷 아웃은 SSC (Serial Stamp Collecting Pipeline)에 의해 만들어지며 필드의 프레임도 정렬됩니다. 아래에서는 단일 프레임의 일부에서 수행되는 일부 처리 단계의 예를 보여줍니다. 큰 이미지를 보려면 각 사진을 클릭하십시오.

원시 데이터 프레임. 두 증폭기의 바이어스 레벨 차이를 볼 수 있습니다.

바이어스 수정 프레임 포화 픽셀, 불량 열 및 녹색으로 마스크 된 우주선.

프레임 수정 포화 픽셀, 불량 열 및 우주선의 경우.

측정 대상, 마스킹되고 상자에 포함됩니다. 작은 빈 상자는 일부 다른 밴드에서만 감지되는 물체입니다.

재구성 된 이미지 비닝 된 이미지에서 개별 개체의 우표와 하늘 배경을 사용합니다.

이미징 데이터가 이러한 파이프 라인을 통해 실행되면 5 개 필터의 이미지를 결합하여이 사이트에서 아름다운 컬러 이미지에 액세스 할 수 있습니다. 또한 모든 물체의 측정 된 매개 변수는 천문학 자들이 연구하고 싶은 물체를 찾기 위해 검색 할 수있는 데이터베이스에 저장됩니다.


데이터 조직

SDSS 카탈로그 데이터 모델

SDSS 카탈로그 데이터는 Microsoft의 SQL Server 인 상용 관계형 데이터베이스 관리 시스템 (DBMS)에 저장됩니다. 따라서 데이터는 여러 2 차원 테이블로 구성됩니다. 테이블과 서로 간의 관계를 개요 데이터베이스 전문 용어로. 위의 메뉴 모음에있는 스키마 링크를 클릭하면 데이터베이스 스키마를 찾아 볼 수있는 스키마 페이지로 이동합니다.

DR12 스키마의 다이어그램보기

표에는 3 가지 유형의 데이터가 있습니다. 이미징 데이터는 사진 테이블 그룹, 분광 및 타일링 데이터는 분광 사진 및 분광 데이터 (예 : 메타 데이터)에 대한 문서 또는 기타 정보와 같은 기타 데이터는 메타 테이블. 일부 테이블은 속도 나 편의를 위해 특별히 생성됩니다. 예를 들어 SpecPhotoAll 테이블은 PhotoObjAll 및 SpecObjAll 테이블에서 관련 필드의 사전 계산 된 JOIN을 포함합니다.

중요한 테이블은 아래에 설명되어 있습니다. 견해 현재 각 테이블에 정의되어 있습니다. 뷰는 테이블 대신 사용할 수있는 해당 테이블의 하위 집합입니다. 즉, 가상 테이블. 보기는 개체의 하위 집합 만로드하기 때문에 일반적으로 기본 테이블을 사용하는 것보다 빠릅니다. 그러나 더 중요한 것은 테이블에서 정의한보기가 과학에 중요한 개체 만 선택하고 비과학을 필터링한다는 것입니다. 하늘, QA 또는 결함 관측과 같은 물체. 따라서 아래에 완성도를 위해 기본 테이블을 나열했지만 대부분의 경우 테이블 자체 대신 테이블에 정의 된 뷰를 사용해야합니다.예 : PhotoObjAll 및 SpecObjAll 테이블 대신 과학 용 PhotoObj 및 SpecObj보기를 사용하십시오.

이미징 (사진) 데이터 테이블

-데이터베이스에서 가장 큰 테이블 인 PhotoObjAll은 각 이미징 (사진) 개체에 대한 100 개 이상의 매개 변수를 포함합니다. 이러한 매개 변수의 대부분에는 실제로 각 파장 대역에 대해 하나씩 5 개의 행이 있습니다. 이 표에는 다음에 대한 데이터가 포함되어 있습니다. 모두 과학 개체뿐만 아니라 사진 개체, 따라서 이름 PhotoObj모두. 과학 개체 만 포함하고 하늘 및 기타 알 수없는 개체를 제외하는이 테이블의보기는 PhotoObj 전망. PhotoObjAll 테이블은 완전성을 위해 존재하지만 과학 쿼리는 일반적으로 PhotoObj보기에서 수행됩니다.

모든보기 :

이름보기내용기술
포토 패밀리 이들은 PhotoObj에 있지만 PhotoPrimary 또는 Photosecondary는 없습니다. 이러한 물체는 1 차 측량 물체도 2 차 측량 물체도 아닌 합성 물체 또는 부당하게 분리 된 물체의 일부 (은하의 나선 팔처럼) 인 경우 생성됩니다. 이러한 개체는 deblender가 어떻게 작동하는지 추적하기 위해 보관됩니다. PhotoObj 클래스의 모든 멤버를 상속합니다.
PhotoObj 각 포토 메트릭 (이미지) 객체의 모든 속성을 포함하는 PhotoObjAll 테이블의 모든 기본 및 보조 객체. mode = 1 또는 2로 PhotoObj를 선택합니다.
PhotoPrimary 이러한 개체는 기본 측량 개체입니다. 하늘의 각 물리적 개체에는 연결된 기본 개체가 하나만 있습니다. 후속 관찰시 보조 개체가 생성됩니다. 측량 줄무늬가 겹치기 때문에 모든 기본 개체의 10 % 이상에 대한 보조 개체가 있고, 남쪽 줄무늬에는 각 기본 개체 (즉, 재 관찰)에 대해 여러 보조 개체가 있습니다.
PhotoSecondary 보조 객체는 동일한 기본 객체의 재 관찰입니다.
포토 태그 PhotoObjAll의 가장 인기있는 칼럼. 이 뷰에는 PhotoObjAll 테이블에서 가장 많이 사용되는 열이 포함되어 있으며 캐시를 사용하여 이러한 열만 요청하는 경우 더 빠른 쿼리를 사용하도록 설정되었습니다. 또한 기본 테이블 (PhotoObjAll)에서이 뷰의 열을 포함하는 인덱스를 통해 성능이 향상됩니다.

PhotoObjAll 지수 :

-이 표에는 각 이미징 필드의 ​​모든 측정 매개 변수가 포함되어 있습니다., 관련 요약 통계, 천체 및 측광 정보와 함께.

필드 인덱스 :

-이 표에는 SDSS 사진 개체의 조명 프로필이 포함되어 있습니다.

PhotoProfile 지수 :

-이 표에는 SDSS 필드 개체의 조명 프로필이 포함되어 있습니다.

FieldProfile 인덱스 :

-0.5 arcmins 이내의 SDSS 개체와 일치 매개 변수가 여기에 저장됩니다. 보조와 같이 원하지 않는 PhotoObj를 필터링하십시오.

이웃 지수 :

Spectro / Tiling / GalSpec / SPP 데이터 테이블

-이 테이블에는 분광 관찰에 사용되는 지정된 플레이트에서 내 보낸 데이터 (X는 내 보낸 데이터)가 포함되어 있습니다. 각 플레이트에는 640 개의 관찰 된 스펙트럼이 있으므로 SpecObjAll에 640 개의 해당 항목이 있습니다.

PlateX 지수 :

-이것은 포함 된 기본 테이블입니다 모두 많은 중복 및 불량 데이터를 포함한 분광 정보. 사용 SpecObj 대신보기 (아래 참조)는 데이터가 청결을 위해 적절하게 필터링되었습니다.

SpecObjAll보기 :

이름보기내용기술
SpecObj 깨끗한 스펙트럼 만있는 Spectro 개체의보기입니다. 이보기는 QA 및 Sky와 중복을 제외합니다. 이것을 스펙트럼 개체에 액세스하는 주요 방법으로 사용하십시오.

SpecObjAll 지수 :

-SpecObjAll에있는 물체의 결합 된 분광 및 사진 매개 변수. 이것은 PhotoObjAll 및 SpecObjAll 테이블 간의 사전 계산 된 조인입니다. 사진 속성에는 PhotoTag보기에서와 거의 동일한 표지가 포함되었습니다. 이 테이블에는 타일 테이블의 특정 속성도 포함됩니다.

SpecPhotoAll보기 :

이름보기내용기술
SpecPhoto 깨끗한 스펙트럼을 가진 결합 된 Spectro 및 Photo 개체의보기입니다. 보기에는 SpecObj가 sciencePrimary이고 BEST PhotoObj가 PRIMARY (mode = 1) 인 쌍만 포함됩니다.

SpecPhotoAll 지수 :

-개별 타일에 대한 정보를 포함합니다. 하늘에.

SdssTileAll보기 :

이름보기내용기술
sdssTile untiled = 0 인 sdssTileAll보기 보기는 종료 된 sdssTiles를 제외합니다.

SdssTileAll 인덱스 :

-이 테이블은 타겟 />이 타일 />에 할당 된 이유를 추적하는 정보를 저장합니다.

SdssTiledTargetAll보기 :

SdssTiledTargetAll 인덱스 :

-이 테이블은 타일링 경계를 포함하여 타일링 영역에 대한 기하학적 정보를 포함합니다. TileBoundary보기는 경계를 제공합니다.

SdssTilingGeometry보기 :

이름보기내용기술
sdssTilingBoundary isMask = 0 인 sdssTilingGeometry 개체의보기 보기는 isMask = 1 인 sdssTilingGeometry 개체를 제외합니다. sdssTilingMask도 참조하십시오.
sdssTilingMask isMask = 1 인 sdssTilingGeometry 개체의보기 보기는 isMask = 0 인 sdssTilingGeometry 개체를 제외합니다. sdssTilingBoundary를 참조하십시오.

SdssTilingGeometry 인덱스 :

, galSpecIndx, galSpecInfogalSpecLine-이 표에는 추정 된 물리적 매개 변수, 스펙트럼 지수 측정, 분광 분석에 대한 일반 정보 및 MPA-JHU 분광 카탈로그의 방출 선 측정이 포함되어 있습니다.

GalSpecExtra 인덱스 :

인덱스 유형키 또는 필드 목록
기본 키specObjID

GalSpecIndx 인덱스 :

GalSpecInfo 인덱스 :

인덱스 유형키 또는 필드 목록
기본 키specObjID

GalSpecLine 인덱스 :

sppParams-이 테이블에는 Stellar Parameter Pipeline의 라인 및 매개 변수 측정이 포함됩니다.


SDSS 데이터 사용 / 카탈로그 찾기-천문학

이제 우리는 천문학 응용 프로그램에서 데이터 마이닝 알고리즘을 사용하고 몇 가지 일반적인 문제를 해결하는 데있어 그 실적을 살펴 봅니다. 섹션 2에서 우리는 데이터 마이닝에 익숙하지 않은 천문학자를위한 용어를 소개했으며, 여기서는 천문학 전문가가 아닌 사람들을 위해 천문학적 문제에 대해 간단히 설명했습니다. 그러나 전체 설명은이 리뷰의 범위를 벗어납니다. 섹션 2는 데이터 마이닝 알고리즘 및 문제에 따라 세분화되었지만 여기서 세분화는 천체 물리학입니다. 이 섹션에서는 섹션 2 : PCA, ANN, DT, SVM에 소개 된 약어에 따라 자주 언급되거나 더 긴 이름을 가진 데이터 마이닝 알고리즘을 축약합니다. 케이NN, KDE, EM, SOM 및 ICA.

데이터 마이닝 도구를 구성하는 요소에 대한 정확한 정의가 없기 때문에 해당 응용 프로그램에 대한 전체 개요를 제공 할 수 없습니다. 따라서이 섹션에서는 실제 또는 묵시적인 추가 가능성과 함께 현재까지 다양한 실제 사용을 설명합니다. 현재 존재하지만 시간 도메인과 같이 미래에 더 큰 중요성을 얻을 가능성이있는 사용은 주로 4 절로 연기됩니다. 천문학에서 기계 학습 알고리즘의 응용에 대한 몇 가지 다른 개요가 있으며 ANN에 대한 예제를 포함하여 추가 예제를 포함합니다. 103, 104, 105, 106, 107], DT [108], 유전 알고리즘 [109], 항성 분류 [110].

이 섹션의 대부분의 응용 프로그램은 데이터 마이닝 알고리즘을 사용하는 천문학 자에 의해 만들어졌습니다. 그러나 고 에너지 물리학 및 의학과 같은 다른 분야와 함께 천문학은 접근 방식에 적합한 많은 대규모 데이터 세트를 생성했기 때문에 천문 데이터를 활용하는 데이터 마이닝 전문가에 의해 여러 프로젝트와 연구가 수행되었습니다. 이러한 프로젝트의 예로는 디지털화 된 하늘 측량에서 카탈로그 제작 및 카탈로그 분석을위한 Sky Image Cataloging and Analysis System (SKICAT) [111], 특히 두 번째 Palomar Observatory Sky Survey 스캔 작업 인 Jet Propulsion Laboratory Adaptive Recognition Tool (JARTool)이 있습니다. ) [112], Magellan 임무에 의해 반환 된 30,000 개 이상의 금성 이미지에서 화산을 인식하는 데 사용되었습니다. 이후 더 일반적인 Diamond Eye [113]와 Lawrence Livermore National Laboratory Sapphire 프로젝트 [114]. 이 관점에서 데이터 마이닝에 대한 최근 리뷰는 책에서 Kamath에 의해 제공됩니다. 과학 데이터 마이닝 [115]. 일반적으로 데이터 마이너는 도메인 과학자보다 더 적절하고 현대적이며 정교한 알고리즘을 사용할 가능성이 있지만 문제의 어떤 측면이 가장 중요한지에 대한 지식을 습득하려면 도메인 과학자와 협력해야합니다.

분류는 가설을 만들고 모델과 비교하는 데 사용할 수있는 방식으로 정보를 구성하는 방법을 제공하기 때문에 과학적 과정에서 중요한 초기 단계입니다. 객체 분류에서 유용한 두 가지 개념은 다음과 같습니다. 완전성 그리고 능률, 재현율 및 정밀도라고도합니다. 이는 참 및 거짓 긍정 (TP 및 FP)과 참 및 거짓 부정 (TN 및 FN)의 관점에서 정의됩니다. 완전성은 해당 유형으로 분류되는 주어진 유형의 진정으로 객체의 비율입니다.

효율성은 실제로 해당 유형의 주어진 유형으로 분류 된 객체의 비율입니다.

이 두 가지 양은 천체 물리학 적으로 흥미 롭습니다. 왜냐하면 하나는 분명히 더 높은 완전성과 효율성을 모두 원하지만 일반적으로 트레이드 오프가 관련되기 때문입니다. 각각의 중요성은 종종 응용 프로그램에 따라 달라집니다. 예를 들어 희귀 물체를 조사하려면 일반적으로 일부 오염 (낮은 효율성)을 허용하면서 높은 완성도가 필요하지만 우주적 물체의 통계적 클러스터링은 완성도를 희생하더라도 높은 효율성이 필요합니다.

우리와의 거리에 비해 물리적 크기가 작기 때문에 거의 모든 별이 포토 메트릭 데이터 세트에서 해결되지 않아 포인트 소스로 나타납니다. 그러나 은하는 멀리 떨어져 있음에도 불구하고 일반적으로 더 큰 각도를 차지하므로 확장 된 출처로 나타납니다. 그러나 퀘이사 및 초신성과 같은 다른 천체 물리학 적 물체도 점원으로 나타납니다. 따라서 광도 카탈로그를 별과 은하, 또는 더 일반적으로 별, 은하 및 기타 물체로 분리하는 것이 중요한 문제입니다. 전형적인 측량 (10 8 이상)에서 은하와 별의 수는 그와 같은 분리가 자동화되어야합니다.

이 문제는 잘 연구 된 문제이며, 예를 들어 APM [116] 및 DPOSS [117]와 같은 기계로 사진 판을 스캔하여 디지털화하는 동안 현재 데이터 마이닝 알고리즘이 대중화되기 전에 자동화 된 접근 방식이 사용되었습니다. ANN [118, 119, 120, 121, 122, 123, 124], DT [125, 126], 혼합 모델링 [127] 및 SOM [128]을 포함한 여러 데이터 마이닝 알고리즘이 사용되었으며, 대부분의 알고리즘은 95 % 효율성. 일반적으로 이것은 측량 광도계에서 파생 된 측정 된 형태 학적 매개 변수 세트를 사용하여 수행되며, 아마도 색상 또는 이전과 같은 기타 정보와 함께 수행됩니다. 이 데이터 마이닝 접근 방식의 장점은 각 개체에 대한 모든 정보가 쉽게 통합된다는 것입니다. 단순한 출력 'star'또는 'galaxy'뿐만 아니라 섹션 2에 설명 된 많은 개선은 확률 적 출력 및 배깅을 포함하여 개선 된 결과를 제공합니다 [126].

그림 5에서 볼 수 있듯이, 은하들은 다양한 크기와 모양, 또는 더 집합 적으로 형태로 나타납니다. 은하의 형태 학적 분류에 대해 가장 잘 알려진 시스템은 다양한 하위 분류와 함께 타원, 나선, 막대 나선, 불규칙한 허블 수열이다 [129, 130, 131, 132, 133, 134]. 이 시스템은 은하의 형성과 진화에 중요한 것으로 알려진 많은 물리적 특성과 관련이 있습니다 [135, 136]. 다른 잘 알려진 분류 체계로는 은하의 농도 지수 [137, 138, 139], de Vaucouleurs [140], 지수 [141, 142], S & # 233rsic 지수 [143, 144] 측정에 기반한 Yerkes 시스템이 있습니다. light profile, David Dunlap Observatory (DDO) 시스템 [145, 146, 147], 농도 비대칭 응집 (CAS) 시스템 [148].

은하의 형태는 근본적인 물리학과 관련이 있지만 주어진 과정에 고유하지 않은 복잡한 현상이기 때문에 허블 시퀀스는 다소 주관적이고 원래 청색 편향 사진 판에서 파생 된 가시광 형태를 기반으로하지만 견뎌 왔습니다. . 허블 시퀀스는 다양한 방식으로 확장되었으며 데이터 마이닝을 위해 T 시스템 [149, 150]이 광범위하게 사용되었습니다. 이 시스템은 범주 형 허블 유형 E, S0, Sa, Sb, Sc, Sd 및 Irr을 숫자 값 -5에서 10까지 매핑합니다.

따라서 측정 된 매개 변수를 사용할 수있는 이미지에 T 유형을 할당하는 감독 알고리즘을 훈련 할 수 있습니다. 이러한 매개 변수는 순전히 형태 학적이거나 색상과 같은 다른 정보를 포함 할 수 있습니다. Lahav와 공동 연구자들이 작성한 일련의 논문 [152, 153, 154, 155, 104, 156]은 ANN을 적용하여 낮은 적색 편이에서 은하의 T 유형을 예측하고 인간 전문가에게 동일한 정확도를 발견함으로써이를 정확하게 수행합니다. ANN은 또한 정상 은하와 특이 은하를 구별하기 위해 더 높은 적색 편이 데이터에 적용되었으며 [157], 기본적으로 토폴로지 및 감독되지 않은 SOM ANN은 허블 우주 망원경 이미지 [74]에서 은하를 분류하는 데 사용되었습니다. 불명. 마찬가지로 ANN은 은하 스펙트럼에서 형태 학적 유형을 얻는 데 사용되었습니다. [158]

몇몇 저자들은 일반적으로 은하들이 훨씬 더 멀고, 희미하고, 덜 진화하고, 형태 학적으로 특이한 Hubble Deep Fields를 사용하여 더 높은 적색 편이에서 은하의 형태를 연구합니다. 세 가지 연구 [159, 160, 161]는 은하를 E / S0, Sabc 및 Sd / Irr로 분류하기 위해 표면 밝기 및 광 프로파일에 대해 훈련 된 ANN을 사용합니다. 또 다른 애플리케이션 [162]은 은하 이미지에서 푸리에 분해를 사용한 다음 ANN을 사용하여 막대를 감지하고 T 유형을 할당합니다.

Bazell & amp Aha [163]는 분류 오류를 줄이기 위해 ANN 및 DT를 포함한 분류기 앙상블을 사용하고 Bazell [164]은 다양한 측정 된 입력 속성의 중요성을 연구하여 단일 측정 매개 변수가 분류를 완전히 재현하지 않음을 발견했습니다. 공 et al. Naim과 유사한 결과 얻기 et al. [155], 그러나 SDSS를 위해 업데이트되었습니다. 공 et al. [166]과 Ball, Loveday & amp Brunner [167]는 SDSS의 이변 량 광도 함수와 형태-밀도 관계 연구에서 이러한 분류를 활용합니다. 이러한 연구는이 크기의 디지털 하늘 조사와 상세한 허블 유형을 모두 활용 한 최초의 연구입니다. .

은하 형태의 복잡한 특성과 이용 가능한 접근 방식의 과다로 인해 많은 추가 연구가 존재합니다. Kelly & amp McKay [168] (그림 6)는 -아르 자형 형태를 통합하는 스키마 내에서 혼합 모델을 사용합니다. Serra-Ricart et al. 인코더 ANN을 사용하여 다양한 데이터 세트의 차원을 줄이고 형태를 포함한 여러 응용 프로그램을 수행합니다. Adams & amp Woolley [170]는 '폭포'배열에서 ANN위원회를 사용합니다. 여기서 한 ANN의 출력이 다른 ANN에 입력을 형성하여 더 자세한 클래스를 생성하여 결과를 개선합니다. Molinari & amp Smareglia [171]는 SOM을 사용하여 성단에서 E / S0 은하를 식별하고 광도 기능을 측정합니다. de Theije & amp Katgert [172] 스펙트럼 주성분을 사용하여 E / S0과 나선 은하를 분리하고 클러스터에서 운동학을 연구합니다. 유전 알고리즘은 속성 선택을 위해 사용되고 [173, 174] FIRST 무선 측량 데이터에서 'bent-double'은하를 분류하기 위해 ANN을 진화시키기 위해 사용되었습니다. 전파 형태는 전파 은하의 조밀 한 핵과 극도로 긴 제트를 결합합니다. 따라서 구부러진 이중 형태는 은하단의 존재를 나타냅니다. de la Calleja & amp Fuentes [176]는 ANN 앙상블과 국부적으로 가중 회귀를 결합합니다. ANN을 넘어서 Spiekermann [177]은 퍼지 대수 및 휴리스틱 방법을 사용하여 이제 막 등장하기 시작하는 확률 적 연구 (섹션 4.1)의 중요성을 예상합니다. Owens, Griffiths & amp Ratnatunga [178]는 비스듬한 DT를 사용하여 ANN과 유사한 결과를 얻었습니다. Zhang, Li & amp Zhao [179]는 k- 평균 클러스터링을 사용하여 초기 유형과 후기 유형을 구분합니다. SVM은 최근 Huertas-Company의 COSMOS 설문 조사에 사용되었습니다. et al. [50, 180], 조기 늦게 분리 가능 케이AB = CAS 시스템보다 2 배 더 우수한 22 mag. SVM은 Gaia 위성의 데이터에도 사용됩니다 [181].

최근 인기 갤럭시 동물원 프로젝트 [182]는 형태 학적 분류에 대한 대안적인 접근 방식을 취했습니다. 크라우드 소싱: 일반 대중의 구성원이 SDSS의 이미지를보고 개요 된 체계에 따라 분류를 할당 할 수있는 애플리케이션이 온라인으로 제공되었습니다. 이 프로젝트는 매우 성공적이었으며, 6 개월 동안 100,000 명이 넘는 사람들이 893,212 개의 은하 샘플에 대해 4 천만 개 이상의 분류를 제공했습니다. 아르 자형 = 17.77 매기. 분류에는 이전에 천문 데이터 마이닝 연구에서 할당되지 않은 범주 (예 : 엣지 온 또는 나선 팔의 손재주)가 포함되었으며이 프로젝트는 여러 과학적 결과를 산출했습니다. 이 접근 방식은 자동화 된 알고리즘에 대한 보완적인 접근 방식을 나타냅니다. 왜냐하면 인간은 알고리즘이 놓칠 수있는 것을 볼 수 있고 다른 시스템 오류를 겪을 수 있지만 런타임이 엄청나게 길기 때문입니다. 훈련 된 ANN은 몇 분 안에 동일한 4 천만 개의 분류를 생성합니다. , 6 개월이 아닙니다.

은하의 많은 물리적 특성과 분류는 항성 인구에 의해 결정됩니다. 따라서 은하의 스펙트럼은 분류를위한 또 다른 방법이며 [183, 184], 때로는 형태보다 근본적인 물리학에 대한 더 명확한 연결을 생성 할 수 있습니다. 스펙트럼 유형은 다른 기본 물리적 프로세스에 의해 구동되기 때문에 다양한 형태 학적 유형이 동일한 스펙트럼 유형을 가질 수 있고 그 반대도 가능하기 때문에 스펙트럼 분류가 중요합니다.

수많은 연구 [185, 186, 187, 188]에서 스펙트럼 분류를 위해 PCA를 직접 사용했습니다. PCA는 ANN [189]을 사용하여 스펙트럼 유형을 분류하기 전에 전처리 단계로 자주 사용됩니다. Folkes, Lahav & amp Maddox [190]는 스펙트럼 및 Ball을 사용하여 2dF Galaxy Redshift Survey (2dFGRS) [191]의 형태 학적 유형을 예측합니다. et al. ANN을 사용하여 SDSS의 스펙트럼 유형을 직접 예측합니다. 슬로 님 et al. 원하는 클래스 수에 대한 스펙트럼 정보를 최대한 보존하는 2dFGRS 스펙트럼에서 정보 병목 방식을 사용합니다. 루 et al. [193] 은하 스펙트럼의 구성 요소에 대한 ICA에 대한 앙상블 학습을 사용합니다. 압달라 et al. 광도계에서 방출 선 특성을 직접 예측하기 위해 ANN 및 국부 가중치 회귀를 사용합니다.

Bazell & amp Miller [82]는 ESO-LV [195] 및 SDSS EDR (Early Data Release) 카탈로그에 ANN을 사용하는 클래스 발견에 적합한 반 감독 방법을 적용했습니다. 그들은 순전히 감독되는 ANN에 비해 분류 오류를 최대 57 %까지 줄일 수 있음을 발견했습니다. 두 카탈로그 중 더 큰 SDSS EDR은 SDSS 최종 데이터 릴리스의 약 6 %에 해당하는 예비 데이터 세트를 나타내며,이 접근 방식의 아직 미개발 잠재력을 명확하게 나타냅니다. 준지도 접근 방식은 또한 전체 매개 변수 공간에 걸쳐 있지 않더라도 사용 가능한 기존 학습 세트를 활용하기 위해 포토 메트릭 적색 편이 (섹션 3.2)에 대한 하이브리드 경험적 템플릿 접근 방식과 유사합니다. 그러나 Bazell & amp Miller가 사용하는 접근 방식은 새로운 객체 클래스를 추가 할 수있는 반면 하이브리드 접근 방식은 기존 템플릿 만 반복 할 수 있기 때문에 더 일반적입니다.

우주에서 방출되는 전자기 복사의 대부분은 별이나 활성 은하 핵 (AGN)의 초 거대 질량 블랙홀을 둘러싼 축적 디스크에서 나옵니다. 후자의 현상은 중앙 지역의 빛이 은하계의 나머지 부분을 능가 할 수있는 퀘이사의 경우 특히 극적입니다. 초 거대 질량 블랙홀은 큰 은하에서 상당히 편재하는 것으로 생각되며, 그 연료 공급과 고유 밝기는 호스트 은하를 둘러싼 환경의 영향을받을 수 있기 때문에 퀘이사 및 기타 AGN은 다음과 같은 구조의 형성과 진화를 이해하는 데 중요합니다. 우주.

The selection of quasars and other AGN from an astronomical survey is a well-known and important problem, and one well suited to a data mining approach. It is well-known that different wavebands (X-ray, optical, radio) will select different AGN, and that no one waveband can select them all. Traditionally, AGN are classified on the Baldwin-Phillips-Terlevich diagram [196], in which sources are plotted on the two-dimensional space of the emission line ratios [O III] 5007 / H and [N II] / H, that is separated by a single curved line into star-forming and AGN regions. Data mining not only improves on this by allowing a more refined or higher dimensional separation, but also by including passive objects in the same framework (Fig. 7). This allows for the probability that an object contains an AGN to be calculated, and does not require all (or any) of the emission lines to be detected.

Several groups have used ANNs [197, 198, 199] or DTs [200, 201, 126, 202, 203, 204, 205] to select quasar candidates from surveys. 하얀 et al. [200] show that the DT method improves the reliability of the selection to 85% compared to only 60% for simpler criteria. Other algorithms employed include PCA [206], SVM and learning vector quantization [207], kd-tree [208], clustering in the form of principal surfaces and negative entropy clustering [209], and kernel density estimation [210]. Many of these papers combine multiwavelength data, particularly X-ray, optical, and radio.

Similarly, one can select and classify candidates of all types of AGN [211]. If multiwavelength data are available, the characteristic data mining algorithm ability to form a model of the required complexity to extract the information could enable it to use the full information to extract more complete AGN samples. More generally, one can classify both normal and active galaxies in one system, differentiating between star formation and AGN. As one example, DTs have been used [126] to select quasar candidates in the SDSS, providing the probabilities P(star, galaxy, quasar). P(star formation, AGN) could be supplied in a similar framework. Bamford et al. [212] combine mixture modeling and regression to perform non-parametric mixture regression, and is the first study to obtain such components and then study them versus environment. The components are passive, star-forming, and two types of AGN.

Often, the first component of classification is the actual process of object detection, which often is done at some signal-to-noise threshold. Several statistical data mining algorithms have been employed, and software packages written, for this purpose, including the Faint Object Classification and Analysis System (FOCAS) [213], DAOPHOT [214], Source Extractor (SExtractor) [215], maximum likelihood, wavelets, ICA [216], mixture models [217], and ANNs [121]. Serra-Ricart et al. [218] show that ANNs are able to classify faint objects as well as a Bayesian classifier but with considerable computational speedup.

Several studies are more general than star-galaxy separation or galaxy classification, and assign classifications of varying detail to a broad range of astrophysical objects. Goebel et al. [219] apply the AutoClass Bayesian classifier to the IRAS LRS atlas, finding new and scientifically interesting object classes. McGlynn et al. [220] use oblique DTs in a system called ClassX to classify X-ray objects into stars, white dwarfs, X-ray binaries, galaxies, AGN, and clusters of galaxies, concluding that the system has the potential to significantly increase the known populations of some rare object types. Suchkov, Hanisch & Margon [201] use the same system to classify objects in the SDSS. Bazell, Miller & Subbarao [221] apply semi-supervised learning to SDSS spectra, including those classified as `unknown', finding two classes of objects consisting of over 50% unknown.

Stellar classifications are necessarily either spectral or based on color, due to the pointlike nature of the source. This field has a long history and well established results such as the HR diagram and the OBAFGKM spectral sequence. The latter is extended to a two-dimensional system of spectral type and luminosity classes I-V to form the two-dimensional MK classification system of Morgan, Keenan & Kellman [222]. Class I are supergiants, through to class V, dwarfs, or main-sequence stars. The spectral types correspond to the hottest and most massive stars, O, through to the coolest and least massive, M, and each class is subdivided into ten subclasses 0-9. Thus, the MK classification of the sun is G2V.

The use of automated algorithms to assign MK classes is analogous to that for assigning Hubble types to galaxies in several ways: before automated algorithms, stellar spectra were compared by eye to standard examples the MK system is closely correlated to the underlying physics, but is ultimately based on observable quantities the system works quite well but has been extended in numerous ways to incorporate objects that do not fit the main classes (e.g., L and T dwarfs, Wolf-Rayet stars, carbon stars, white dwarfs, and so on). Two differences from galaxy classification are the number of input parameters, in this case spectral indices, and the number of classes. In MK classification the numbers are generally higher, of order 50 or more input parameters, compared to of order 10 for galaxies.

Given a large body of work for galaxies that has involved the use of artificial neural networks, and the similarities just outlined, it is not surprising that similar approaches have been employed for stellar classification [223, 224, 225, 226, 227, 228], with a typical accuracy of one spectral type and half a luminosity type. The relatively large number of object attributes and output classes compared to the number of objects in each class does not invalidate the approach, because the efforts described generally find that the number of principal components represented by the inputs is typically much lower. A well-known property of neural networks is that they are robust to a large number of redundant attributes (Section 2.4.5).

Neural networks have been used for other stellar classifications schemes, e.g. Gupta et al. [229] define 17 classes for IRAS sources, including planetary nebulae and HII regions. Other methods have been employed a recent example is Manteiga et al. [230], who use a fuzzy logic knowledge-based system with a hierarchical tree of decision rules. Beyond the MK and other static classifications, variable stars have been extensively studied for many years, e.g., Wozniak et al. [231] use SVM to distinguish Mira variables.

The detection and characterization of supernovae is important for both understanding the astrophysics of these events, and their use as standard candles in constraining aspects of cosmology such as the dark energy equation of state. 외벽 et al. [232] use boosted DTs, random forests, and SVMs to classify supernovae in difference images, finding a ten times reduction in the false-positive rate compared to standard techniques involving parameter thresholds (Fig. 8).

Given the general nature of the data mining approach, there are many further classification examples, including cosmic ray hits [39, 233], planetary nebulae [234], asteroids [235], and gamma ray sources [236, 237].

An area of astrophysics that has greatly increased in popularity in the last few years is the estimation of redshifts from photometric data (photo-s). This is because, although the distances are less accurate than those obtained with spectra, the sheer number of objects with photometric measurements can often make up for the reduction in individual accuracy by suppressing the statistical noise of an ensemble calculation.

Photo-zs were first demonstrated in the mid 20th century [238, 239], and later in the 1980s [240, 241]. In the 1990s, the advent of the Hubble Space Telescope Deep fields resulted in numerous approaches [242, 243, 244, 245, 246, 247, 248], reviewed by Koo [249]. In the past decade, the advent of wide-field CCD surveys and multifiber spectroscopy have revolutionized the study of photo-s to the point where they are indispensable for the upcoming next generation surveys, and a large number of studies have been made.

The two common approaches to photo-s are the template method and the empirical training set method. The template approach has many complicating issues [250], including calibration, zero-points, priors, multiwavelength performance (e.g., poor in the mid-infrared), and difficulty handling missing or incomplete training data. We focus in this review on the empirical approach, as it is an implementation of supervised learning. In the future, it is likely that a hybrid method incorporating both templates and the empirical approach will be used, and that the use of full probability density functions will become increasingly important. For many applications, knowing the error distribution in the redshifts is at least as important as the accuracy of the redshifts themselves, further motivating the calculation of PDFs.

At low redshifts, the calculation of photometric redshifts for normal galaxies is quite straightforward due to the break in the typical galaxy spectrum at 4000A. Thus, as a galaxy is redshifted with increasing distance, the color (measured as a difference in magnitudes) changes relatively smoothly. As a result, both template and empirical photo- approaches obtain similar results, a root-mean-square deviation of

0.02 in redshift, which is close to the best possible result given the intrinsic spread in the properties [251]. This has been shown with ANNs [33, 165, 156, 252, 253, 254, 124, 255, 256, 257, 179], SVM [258, 259], DT [260], 케이NN [261], empirical polynomial relations [262, 251, 247, 263, 264, 265], numerous template-based studies, and several other methods. At higher redshifts, obtaining accurate results becomes more difficult because the 4000A break is shifted redward of the optical, galaxies are fainter and thus spectral data are sparser, and galaxies intrinsically evolve over time. The first explorations at higher redshift were the Hubble Deep Fields in the 1990s, described above (Section 3.2), and, more recently, new infrared data have become available, which allow the 4000A break to be seen to higher redshift, which improves the results. Template-based algorithms work well, provided suitable templates into the infrared are available, and supervised algorithms simply incorporate the new data and work in the same manner as previously described.

While supervised learning has been successfully used, beyond the spectral regime the obvious limitation arises that in order to reach the limiting magnitude of the photometric portions of surveys, extrapolation would be required. In this regime, or where only small training sets are available, template-based results can be used, but without spectral information, the templates themselves are being extrapolated. However, the extrapolation of the templates is being done in a more physically motivated manner. It is likely that the more general hybrid approach of using empirical data to iteratively improve the templates, [266, 267, 268, 269, 270, 271] or the semi-supervised method described in Section 2.4.3 will ultimately provide a more elegant solution. Another issue at higher redshift is that the available numbers of objects can become quite small (in the hundreds or fewer), thus reintroducing the curse of dimensionality by a simple lack of objects compared to measured wavebands. The methods of dimension reduction (Section 2.3) can help to mitigate this effect.

Historically, the calculation of photometric redshifts for quasars and other AGN has been even more difficult than for galaxies, because the spectra are dominated by bright but narrow emission lines, which in broad photometric passbands can dominate the color. The color-redshift relation of quasars is thus subject to several effects, including degeneracy, one emission line appearing like another at a different redshift, an emission line disappearing between survey filters, and reddening. In addition, the filter sets of surveys are generally designed for normal galaxies and not quasars. The assignment of these quasar photo-s is thus a complex problem that is amenable to data mining in a similar manner to the classification of AGN described in Section 3.1.4.

The calculation of quasar photo-s has had some success using SDSS data [272, 273, 274, 275, 276, 277], but they suffer from catastrophic failures, in which, as shown in Fig. 9, the photometric redshift for a subset of the objects is completely incorrect. However, data mining approaches have resulted in improvements to this situation. Ball et al. [278] find that a single-neighbor 케이NN gives a similar result to the templates, but multiple neighbors, or other supervised algorithms such as DT or ANN, pull in the regions of catastrophic failure and significantly decrease the spread in the results. Kumar [279] also shows this effect. Ball et al. [261] go further and are able to largely eliminate the catastrophics by selecting the subset of quasars with one peak in their redshift probability density function (Section 4.1), a result confirmed by Wolf [280]. 늑대 et al. [281] also show significant improvement using the COMBO-17 survey, which has 17 filters compared to the five of the SDSS, but unfortunately the photometric sample is much smaller.

Beyond the spectral regime, template-based results are sufficient [282], but again suffer from catastrophics. Given our physical understanding of the nature of quasars, it is in fact reasonable to extrapolate in magnitude when using colors as a training set, because while one is going to fainter magnitudes, one is not extrapolating in color. One could therefore quite reasonably assign empirical photo-s for a full photometric sample of quasars.

Typically in data mining, information gathered from spectra has formed the training set to apply a predictive technique to objects with photometry. However, it is clear from this process that the spectrum itself contains a large amount of information, and data mining techniques may be used directly on the spectra to extract information that might otherwise remain hidden. Applications to galaxy spectral classification were described in Section 3.1.3. In stellar work, besides the classification of stars into the MK system based on observable parameters, several studies have directly predicted physical parameters of stellar atmospheres using spectral indices. One example is Ramirez, Fuentes & Gulati [283], who utilize a genetic algorithm to select the appropriate input attributes, and predict the parameters using 케이NN. The attribute selection reduces run time and improves predictive accuracy. Solorio et al. [284] use 케이NN to study stellar populations and improve the results by using active learning to populate sparse regions of parameter space, an alternative to dimension reduction.

Although it has much potential for the future (Section 4.2), the time domain is a field in which a lot of work has already been done. Examples include the classification of variable stars described in Section 3.1.5, and, in order of distance, the interaction of the solar wind and the Earth's atmosphere, transient lunar phenomena, detection and classification of asteroids and other solar system objects by composition and orbit, solar system planetary atmospheres, stellar proper motions, extrasolar planets, novae, stellar orbits around the supermassive black hole at the Galactic center, microlensing from massive compact halo objects, supernovae, gamma ray bursts, and quasar variability. A good overview is provided by Becker [285]. The large potential of the time domain for novel discovery lies within the as yet unexplored parameter space defined by depth, sky coverage, and temporal resolution [286]. One constraining characteristic of the most variable sources beyond the solar system is that they are generally point sources. As a result, the timescales of interest are constrained by the light crossing time for the source.

The analysis of the cosmic microwave background (CMB) is amenable to several techniques, including Bayesian modeling, wavelets, and ICA. The latter, in particular via the FastICA algorithm [216], has been used in removal of CMB foregrounds [287], and cluster detection via the Sunyaev-Zeldovich effect [288]. Phillips & Kogut [289] use a committee of ANNs for cosmological parameter estimation in CMB datasets, by training them to identify parameter values in Monte Carlo simulations. This gives unbiased parameter estimation in considerably less processing time than maximum likelihood, but with comparable accuracy.

One can use the fact that objects cross-matched between surveys will likely have correlated distributions in their measured attributes, for example, similar position on the sky, to improve cross-matching results using pattern classifiers. Rohde et al. [290] combine distribution estimates and probabilistic classifiers to produce such an improvement, and supply probabilistic outputs.

Taylor & Diaz [291] obtain empirical fits for Galactic metallicity using ANNs, whose architectures are evolved using genetic algorithms. This method is able to provide equations for metallicity from line ratios, mitigating the `black box' element common to ANNs, and, in addition, is potentially able to identify new metallicity diagnostics.

Bogdanos & Nesseris [292] analyze Type Ia supernovae using genetic algorithms to extract constraints on the dark energy equation of state. This method is non-parametric, which minimizes bias from the necessarily a priori assumptions of parametric models.

Lunar and planetary science, space science, and solar physics also provide many examples of data mining uses. One example is Li et al. [293], who demonstrate improvements in solar flare forecasting resulting from the use of a mixture of experts, in this case SVM and 케이NN. The analysis of the abundance of minerals or constituents in soil samples [294] using mixture models is another example of direct data mining of spectra.


Five new giant radio galaxies discovered

One of new GRGs described in the study. The figure shows radio-near infrared overlay of this source, using SDSS i-band image rather than WISE, given its better angular resolution. Credit: Tang et al., 2020

With the help of citizen scientists, astronomers have detected five new giant radio galaxies (GRGs). The new GRGs have sizes ranging from 2.3 to 2.6 million light years, and have been identified at redshift between 0.28 and 0.43. The finding is reported in a paper published September 8 on the arXiv pre-print server.

GRGs are radio galaxies with an overall projected linear length exceeding at least 2.28 million light years. They are rare objects grown in low-density environments. GRGs are important for astronomers to study the formation and the evolution of radio sources.

Now, a team of astronomers led by Hongming Tang of the University of Manchester, UK, reports the finding of five previously unknown GRGs. The detection is based on the Data Release 1 (DR1) of the Radio Galaxy Zoo (RGZ) citizen science project. RGZ DR1 is a manually cross-matched radio galaxy catalog using the efforts of more than 12,000 citizen scientist volunteers.

"In this paper, we present the identification of five previously unknown giant radio galaxies (GRGs) using Data Release 1 of the Radio Galaxy Zoo citizen science project and a selection method appropriate to the training and validation of deep-learning algorithms for new radio surveys," the astronomers wrote in the paper.

The newly identified GRGs are designated J0941+3126, J1331+2557, J1402+2442, J1421+1016 and J1646+3627. They all have comparatively high radio luminosities and are likely to be either elliptical or intermediate disk galaxies.

J1402+2442 (also known as B2 1400+24) is the largest out of the newly found GRGs. It has a redshift of approximately 0.337 and its host is a close pair of galaxies, designated SDSS J140224.25+244224.3 and SDSS J140224.31+244226.8. At a redshift of about 0.28, J0941+3126 (or B2 0938+31A) is the smallest GRG from the five reported in the study. This source is hosted by SDSS J094103.62+312618.7.

In the case of J1646+3627, a GRG with a size of at least 2.46 million light years, at a redshift of 0.43, the researchers found that this object is also the brightest cluster galaxy (BCG) in the galaxy cluster GMBCG J251.67741+36.45295. This finding motivated Tang's team to conduct further study of BCGs. They report that 13 previously known GRGs could be classified as BCG candidates. If confirmed, this would increase the number of known BCG GRGs by more than 60 percent.

The remaining two giant radio galaxies described in the study, namely J1331+2357 and J1421+1016, have sizes of about 2.62 and 2.49 million light years, respectively. J1331+2357 has a redshift of 0.33 and its host galaxy is identified as SDSS J133118.01+235700.4, while J1421+1016, at a redshift of 0.37, has a host galaxy known as SDSS J142142.68+101626.2.


What is in DR16?

    of galaxies, stars and quasars from the SDSS extended Baryon Oscillation Spectroscopic Survey (eBOSS) and prior optical spectroscopic programs. from the SDSS Apache Point Observatory Galaxy Evolution Experiment (APOGEE and APOGEE-2), including stellar abundance estimates for additional elements from the ASPCAP pipeline.
  • Data cubes and maps from integral field unit (IFU) spectroscopic observations of nearby galaxies from the SDSS Mapping Nearby Galaxies at APO (MaNGA) survey
  • Spectra of the MaNGA Stellar Library program (MaStar)
  • Legacy imaging from prior SDSS programs
  • A large selection of Value Added Catalogs (VACs) from current and previous surveys

The Expanding Universe

In two thousand years of astronomy, no one ever guessed that the universe might be expanding. To ancient Greek astronomers and philosophers, the universe was seen as the embodiment of perfection. The heavens were truly heavenly - unchanging, permanent, and geometrically perfect. In the early 1600s, Isaac Newton developed his law of gravity, showing that motion in the heavens could be explained using the same laws as motion on Earth.

However, Newton ran into trouble when he tried to apply his theory of gravity to the entire universe. Since gravity is always attractive, his law predicted that all the matter in the universe should eventually clump into one big ball. Newton knew this was not the case, and assumed that the universe had to be static, so he conjectured that the Creator placed the stars such that they were "at immense distances from one another."


Albert Einstein's Theory of Relativity is the basis for our cosmological models of space and time.

In 1916, Albert Einstein ran into the same problem that Newton did. Einstein had just completed his General Theory of Relativity, which explained gravity in a different way from Newton's law. Like Newton's theory, General Relativity predicted that the universe should be collapsing into a ball. Because Einstein assumed that the universe must be static, he added a constant term to his equations that counteracted gravity on very large distance scales. A few years later, someone pointed out that Einstein's equations had another solution in which the universe should be expanding, but Einstein continued to work with his constant term, believing the universe to be static.

Then, in 1924, Edwin Hubble of the Carnegie Observatories made a new map. He used a new telescope on California's Mount Wilson to observe a series of distant galaxies, and found that light from those galaxies was redshifted - that is, light waves were stretched out like sound waves from a passing siren. The further away the galaxy, Hubble found, the greater the redshift. Hubble's observation showed that the universe was expanding, meaning it had started at a single point called the big bang about fifteen billion years ago. When Einstein heard about Hubble's discovery, he realized that his equations predicted the expanding universe all along, and called his constant term his "biggest blunder." Today, the idea of the expanding universe is the basis for all of modern astronomy.


Using SDSS data / finding a catalog - Astronomy

Welcome to SkyServer! This site gives you access to all the data from the Sloan Digital Sky Survey (SDSS). Here, you will learn how to use exactly the same tools that professional astronomers use.

You are now viewing the catalog data from the Sloan Digital Sky Survey's Data Release 12. (link opens in a new window)

Use the links below, or the links to the left, to go to a help page:

Start Here

Start Here gives you a quick overview of SDSS catalog data, and how to use the data

Cooking with Sloan consists of guides for doing common tasks with SDSS catalog data

FAQ is frequently asked questions about the SDSS and its data

Guide to Searching for Data

SQL Tutorial is an introduction to Structured Query Language (SQL), its scientific uses, and its syntax

SQL in SkyServer contains more detailed information about SQL, including advice making your queries run fast

Sample SQL Queries are many real-life examples of useful SQL queries

Query Limits lists the timeouts and row limits in effect for the various query tools.

Searching advice provides some practical advice on how to search SDSS data

Important Reference Information

About the Database gives an overview of the catalog archive

Table Description provides a description of the database tables

Schema Browser shows you what data you can find in the database

용어 사전 is a list of terms used on the site and in the SDSS

Algorithms describes the SDSS's data reduction algorithms

Detailed Reference Information

SDSS Data Publications is a link to publications that describe the SDSS data in more detail

API contains information on how to programatically access some of the SDSS services

Help Desk

Contact Help Desk allows you to send an email to the SDSS Help Desk if you have a question or problem with the site


Using SDSS data / finding a catalog - Astronomy

It would seem that the calibrated observations obtained by the Sloan Digital Sky Survey (SDSS) by themselves would be, at best, marginally useful for the secure determination of asteroid rotation lightcurves, mostly due to the scarcity of data for a particular object in a given apparition as well as because of the sometimes low photometric quality of the SDSS data. Despite these shortcomings, it was decided to see if the SDSS data could be used to help find the lightcurve parameters of at least some asteroids. Observations of ten asteroids obtained by the SDSS are compared here with lightcurves obtained by asteroid photometric stations using dense data sets. Three asteroids observed during the same apparition as the SDSS observations served to determine the accuracy of the SDSS data. Except for occasional outliers identified on the basis of deviating color indices, the accuracy of the observations was found to be about 0.03 mag in the V band on average, which is a generally accepted level of quality for most asteroid photometry. In addition to the ten asteroids with known lightcurves, another 54 asteroids without known lightcurves, but with more than 20 observations by SDSS, were also examined to derive their absolute magnitudes (H) and plausible composite lightcurves. Lightcurve analyses of (12104) Chesley, (32257) 2000 OW 52 , (39132) 2000 WU 58 , (156751) 2002 XL 92 , (219686) 2001 WE 37 , 1992 WW 6 , and 2007 EP 39 are presented. The asteroids studied in this paper were found to be mostly fainter than predicted from the H values given by the Minor Planet Center in its Orbit Database. The difference between the H values slightly correlates with the lightcurve amplitude.


비디오보기: trakiani policielebi (구월 2022).


코멘트:

  1. Khair Al Din

    어떻게 알아야합니까?

  2. Riccardo

    외면하지 않게 하셨습니다. 완료된 것은 완료됩니다.

  3. Kazragar

    얼마나 훌륭한 구절인가

  4. D'anton

    정말, 정말 마음에 들었습니다!!!

  5. Ioseph

    In my opinion, this is relevant, I will take part in the discussion.



메시지 쓰기